Palestras
do Departamento de Metodos Estatísticos
Instituto de Matemática -
UFRJ
Palestras
dos anos anteriores e respectivos resumos
1o. semestre de 2012
As palestras são realizadas no Auditório do
Laboratório de Sistemas Estocásticos (LSE), sala
I-044b, as 15:30 h, a menos que ocorra aviso em
contrário.
- 13/06 Bernardo N. B.
de Lima
(UFMG)
Título: Percolação
congelada na rede quadrada (Resumo)
- 06/06 Colóquio
Inter-institucional "Modelos
estocásticos e
aplicações" (excepcionalmente
as
14:00 horas no Auditório 1 do IMPA)
- Robert Morris (IMPA)
Noise sensitivity in percolation (Resumo)
- Ivan S. Oliveira (CBPF)
O fantástico computador quântico de dois q-bits:
aplicações utilizando ressonância
magnética nuclear
(Resumo)
- 30/05 Marco Ferreira
(Missouri)
Título: Bayesian
optimal sequential design for nonparametric regression (Resumo)
- 16/05 Luca Martino
(Carlos III)
Título: Some
computational methods for Bayesian inference: from rejection samplers
to Markov chains (Resumo)
- 02/05 Jorge Achcar
(USP)
Título: Modelling
the dependence between two diagnostic tests via copula functions (Resumo)
- 27/04 Renato J. Gava
(USP)
(excepcionalmente uma 6a
feira)
Título: The
K-process on a tree as a scaling limit of the GREM-like trap model (Resumo)
- 18/04 Colóquio
Inter-institucional "Modelos
estocásticos e
aplicações" (excepcionalmente
as
13:30 horas na sala C116 do IM)
- Thereza C. L. Paiva (IF-UFRJ)
Férmions ultra-frios em redes óticas (Resumo)
- Leandro R. Pimentel (IM-UFRJ)
Modelos de crescimento e interfaces de competição
(Resumo)
- 11/04 Eliane
Rodrigues
(UNAM)
Título: Alguns
modelos Markovianos para estudar o tempo entre ultrapasses de limites
para concentração de ozonio (Resumo)
- 28/03 Sergio Camiz
(Roma)
Título: Exploratory
data analysis for the study of images recognition tests (Resumo)
- 21/03 Luigi Ippoliti
(Pescara)
Título: Space-time
modeling of US house prices by spatial dynamic structural
equation models (Resumo)
- 09/03 Jorge
L. Bazan (PUC, Peru) (excepcionalmente
uma 6a feira)
Título: A
proposal for skewed links in binary regression (Resumo)
- 18/01 Matthias Kormaksson (Cornell) (excepcionalmente as 13:30)
Título: Mixture of generalized linear mixed models
with applications in methylation sequencing and proteomics analysis
(Resumo)
Resumos
das palestras do 1o semestre de 2012
Palestrante:
Bernardo Lima
Título: Percolação
congelada na rede quadrada
Resumo
Percolação congelada foi introduzida por D.
Aldous como
um modelo prababilístico para a
formação de um
gel. Dada uma sequência de variáveis
aleatótias
iid, (U_v), com distribuição uniforme em [0,1]
onde v
é um vértice do grafo, o medelo é
definido da
seguinte maneira: no tempo t=0 todos os sítios
estão
inativos, o sítio v passa para o estado ativo no tempo U_v,
quando se forma um aglomerado infinito de sítios ativos
todos os
sítios deste aglomerado passam para o estado congelado.
Deste
modo, no tempo t=1 todos os sítios estão ativos
ou
congelados.
Estudamos uma modificação deste processo, na rede
quadrada, onde o aglomerado congela quando seu diâmetro
atinge o
valor N. Mostramos que no limite quando N tende ao infinito a
probabilidade da origem estar ainda ativa é estritamente
positiva. Trabalho conjunto com J. van den Berg (CWI,
Amsterdã)
e Pierre Nolin (ETH, Zurique).
Palestrante:
Robert Morris
Título: Noise sensitivity in percolation
Resumo
Suppose that in a close election, a small (random) proportion of the
votes are accidentally miscounted; is this random `noise' likely to
change the outcome of the election? It turns out that the answer to
this question depends in interesting ways on the rule (i.e., the
Boolean function f) by which the winner is selected. To take three
simple examples, the answer is ``no'' if the function f is `majority'
or `dictator', but ``yes'' if it is `parity'. The systematic study of
this problem was begun in 1999 by Benjamini, Kalai and Schramm, who
gave a sufficient condition (based on the discrete Fourier coefficients
of f) for the answer to be ``yes'', and used this result to prove that
bond percolation on Z² is noise sensitive at criticality. More
precisely, suppose that we perform critical (i.e., p = 1/2) bond
percolation on Z², observe that there is a horizontal crossing
of
a particular n x n square, and then re-randomize each edge with
probability epsilon > 0. Then the probability of having a
horizontal
crossing in the new configuration is close to 1/2. In this talk we
consider the corresponding question for continuum percolation, and in
particular for the Poisson Boolean model (also known as the Gilbert
disc model). Let eta be a Poisson process of density lambda in the
plane, and connect two points of eta by an edge if they are at distance
at most 1. We prove that, at criticality, the event that there is a
crossing of an n x n square is noise sensitive. The proof is based on
two extremely general tools: a version of the BKS Theorem for product
measure, and a new extremal result on hypergraphs. This is joint work
with Daniel Ahlberg, Erik Broman and Simon Griffiths.
Palestrante:
Ivan S. Oliveira
Título: O fantástico computador
quântico de dois q-bits:
aplicações utilizando ressonância
magnética nuclear
Resumo
A Computação Quântica, ou mais
genericamente, o
Processamento da Informação Quântica,
surgiu como
uma área da física teórica no
início dos
anos 1980. A partir de 1994, com a descoberta do algoritmo de
fatoração de Shor um grande número de
pesquisadores foram atraídos para esta área, e e
em 1997,
a Ressonância Magnética Nuclear (RMN) despontou
como uma
das técnicas experimentais mais promissoras para a
implementação de protocolos de
computação e
comunicação quânticos. Logo se
percebeu, contudo,
que o chamado problema do escalonamento, seria muito difícil
de
ser superado por qualquer técnica experimental em vigor, em
particular a RMN. Os trabalhos então se concentraram em
aspectos
básicos do processamento da informação
quântica em sistemas com um número pequeno de
q-bits, a
unidade de informação quântica. A RMN
encontrou
aí um nicho extraordinário para estudos
fundamentais
sobre emaranhamento, simulação de sistemas
quânticos, e descoerência. Neste
colóquio vamos
apresentar os fundamentos do Processamento da
Informação
Quântica por RMN, com vários exemplos de estudos
em um
sistema com apenas 2 q-bits de informação, o mais
simples
de todos: a molécula do clorofórmio.
Ênfase
será dada aos trabalhos feitos pelo Grupo de
Informação Quântica por RMN do Centro
Brasileiro de
Pesquisas Físicas.
Palestrante:
Marco Ferreira
Título: Bayesian optimal sequential design for
nonparametric regression
Resumo
We develop a novel computational framework for Bayesian optimal
sequential design for nonparametric regression. This computational
framework is based on evolutionary Markov chain Monte Carlo (EMCMC),
which combines ideas of genetic or evolutionary algorithms with the
power of Markov chain Monte Carlo. Our framework is able to consider
general models for the observations, such as exponential family
distributions and scale mixtures of normals. In addition, our framework
allows optimality criteria with general utility functions that may
include competing objectives, such as for example minimization of
costs, minimization of the distance between true and estimated
functions, and minimization of the prediction error. Finally, we
illustrate our novel methodology with applications to experimental
design for nonparametric function estimation.
Palestrante:
Luca Martino
Título: Modelling the dependence between two
diagnostic tests via copula functions
Resumo
Rejection sampling (RS) is a standard technique for universal Monte
Carlo
sampling. It can be used to generate i.i.d. samples from a target
probability density function (pdf) by drawing from a simpler proposal
density. The class of adaptive rejection sampling (ARS) methods are
particularly appealing because they ensure high acceptance rates.
Indeed
they produce a sequence of proposal functions that actually converge
toward
the target pdf when the procedure is iterated. We will discuss a a
novel
family of generalized ARS algorithms which are applicable to a broad
range
of target densities and, furthermore, admit an efficient combination
with
other sampling techniques such as the "ratio of uniforms" method.
In many practical applications, rejection samplers cannot provide a
complete solution to the inference problems to be solved (e.g., when
the
target distribution is large dimensional) but they can still become
useful
blocks for the design of more sophisticated algorithms, such as Markov
chain Monte Carlo (MCMC) methods. We will describe certain MCMC
algorithms
as the Multiple Try MH (MTM) technique and how the latter can be
generalized using either generic weight functions or ARS building
blocks.
Some numerical examples will be provided for illustration.
Palestrante:
Jorge Achcar
Título: Modelling the dependence between two
diagnostic tests via copula functions
Resumo
In medical diagnostic testing, it is common the use of more than one
diagnostic test applied to the same individual. Usually these tests are
assumed to be independents and important performance measures are
estimated as the sensitivities and specificities of the tests, in the
presence or not of a reference test usually known as "gold standard".
These tests could be dependent since they are applied to the same
individual and this assumption could modify the estimation of the
performance measures. Considering two diagnostic tests, we could assume
a bivariate Bernoulli distribution. Alternatively, we propose the use
of different copula functions to model the association between tests.
Under the Bayesian paradigm, the posterior summaries of interest are
obtained using MCMC (Markov Chain Monte Carlo) methods. A detailed
discussion on the elicitation of prior distributions on the test
performance and copula parameter is considered in this study.We
illustrate the proposed methodology considering two medical data sets
introduced in the literature.
Palestrante:
Renato J. Gava
Título: The K-process on a tree as a scaling limit
of the GREM-like trap model
Resumo
We introduce trap models on a finite volume k-level tree as a class of
Markov jump processes with state space the leaves of that tree. They
serve to describe the GREM-like trap model of Sasaki-Nemoto. Under
suitable conditions on the parameters of the trap model, we establish
its infinite volume limit, given by what we call a K process in an
infinite k-level tree. From this we deduce that the K-process also is
the scaling limit of the GREM-like trap model on extreme time scales
under a fine tuning assumption on the volumes. This is a joint work
with L. R. G. Fontes, V. Gayrard.
Palestrante:
Leandro Pimentel
Título: Modelos de crescimento e interfaces de
competição
Resumo
Nesta palestra faremos uma viagem pela teoria de modelos de crescimento
percolativos e suas
interfaces de competição. Veremos resultados
clássicos, como o teorema da forma, bem como
resultados recentes sobre a forma da interface de
competição, além de problemas
fundamentais
que ainda estão em aberto.
Palestrante:
Thereza C. L. Paiva
Título: Férmions ultra-frios em redes
óticas
Resumo
A habilidade de aprisionar átomos bosônicos e
fermiônicos em redes óticas, cujo potencial
cristalino
é gerado por lasers anti-propagantes, a temperaturas ultra
baixas, deu início a uma nova área
de pesquisa, na fronteira entre a Física da
Matéria
Condensada, a Física Atômica e a Ótica.
Ao
contrário do que acontece nos sistemas de Matéria
Condensada, nas redes óticas há um grande
controle sobre os parâmetros envolvidos: as
interações entre os átomos
são controladas
através
de um campo magnético, podendo ser atrativas ou repulsivas,
o
potencial químico é facilmente
controlável e não há desordem. Com
isso, um novo
desenvolvimento nesta área é a possibilidade
de realizar em laboratório modelos para férmions
fortemente correlacionados, dentre os quais o
mais estudado é o modelo de Hubbard. Atualmente, o principal
desafio nesta área é conseguir o
resfriamento necessário para observar fases ordenadas, como
antiferromagnetismo, supercondutividade
ou superfluidez. Neste colóquio vou discutir os
avanços
experimentais e teóricos mais
recentes nesta área.
Palestrante:
Eliane Rodrigues
Título:
Alguns
modelos Markovianos para estudar o tempo entre ultrapasses de limites
para concentração de ozonio
Resumo
Apresentaremos alguns modelos Markovianos para descrever a estrutura de
tempos entre ultrapasses de limites ambientais. Assumimos que tempos
consecutivos são dependentes. Duas possibilidades
serão
consideradas. No primeiro caso, a dependência é
imposta
diretamente na sequência dos tempos entre ultrapasses. No
segundo
caso, a dependência é imposta nos
parâmetros de
escala e forma das densidades assumidas para os tempos entre
ultrapasses. Os modelos descritos serão aplicados a
medições de ozono obtidas da rede de
monitoramento da
Cidade do México. Os resultados apresentados fazem parte de
trabalhos conjuntos com Jorge A. Achcar, Guadalupe Tzintzun, Mario
Tarumoto e Edilberto Cepeda-Cuervo.
Palestrante:
Sergio Camiz
Título:
Exploratory data analysis for the study of images recognition tests
Resumo
The study concerns the exploratory study carried out to provide items
to be submitted to aphasic patients, to evaluate their degree of
desease.
This preliminary study is devoted to the identifications of images to
be submitted, by selecting them from an internationally adopted set of
images.
To select them we proceeded in two steps: i) the selection of the
images based on their facility to be easily to be recognized by the
patients; and ii) the evaluation of the primitiveness of the objects'
nouns to be verbalised, aiming at limiting attention to the most
primitive ones.
Both steps were carried out by submitting items to non-aphasic judges,
in order to evaluate in a neutral way the quality of the items
themselves.
Thus images were submitted to Correspondence Analysis, to identify
those least recognized by the judges, in order to exclude them in the
further step.
Then, the selected objects were submitted to two sets of judges to
evaluate their degree of primitiveness, according to: i) a predefined
seven-steps age scale, and ii) a 1-7 free scale. The results were
submitted first to both Principal Component and Multiple Correspondence
Analyses, to withdraw any judge that resulted an outlier in respect to
others. Then, the remaining data were analysed through Multiple Factor
Analysis, to compare to what extent the two scales of measurement gave
different results: it appeared that the free-scale allowed the judges
to use the whole scale, whereas the predefined one caused the selection
of a limited number of steps. Nevertheless, its first principal
component, that is the objects' scores along the first axis, could be
assumed as a measure of primitiveness.
Palestrante:
Luigi Ippoliti
Título: Space-time modeling of US house prices by
spatial dynamic structural
equation models
Resumo
This talk discusses a spatial dynamic structural equation model for the
analysis of house prices at the State level in the USA. The study
contributes to the existing literature by extending the use of dynamic
factor models to the econometric analysis of multivariate lattice data.
One of the main advantages of our model formulation is that by modeling
the spatial variation via spatially structured factor loadings, we
entertain the possibility of identifying similarity
”regions” that share common time series components.
The
factor loadings are modeled as conditionally independent multivariate
Gaussian Markov Random Fields while the common components are modeled
by latent and dynamic factors. The general model is proposed in a
state-space formulation where both stationary and nonstationary
autoregressive distributed-lag processes for the latent factors are
considered. For the latent factors which exhibit a common trend, and
hence are cointegrated, an error correction specication of the
(vector) autoregressive distributed-lag process is proposed. Full
probabilistic inference for the model parameters is facilitated by
adapting standard Markov chain Monte Carlo (MCMC) algorithms for
dynamic linear models to our model formulation. The fit of the model is
discussed for a data set of 48 States for which we model the
relationship between housing prices and the macroeconomy, using state
level unemployment and per capita personal income.
Palestrante: Jorge
L. Bazan
Título: A proposal for skewed links in binary
regression
Resumo
We propose two new classes of links for the modeling of mixed models
for binary response. We shows that these extensions are appropriate for
the analysis of several typesof correlated data structures, in
particular, for clustered and/or longitudinaldata and, more generally,
in multilevel models. The links proposed can be named as power and
reciprocal power by considering the relationship between them. Both
include usual symmetric links as logit and probit as special cases.
Also,the univariate and the random effects for symmetric links in
binary regression are special cases of the models considered here. A
Bayesian inference approach using MCMC is developed.
Palestrante: Matthias Kormaksson
Título: Mixture of
generalized linear mixed models with applications in methylation
sequencing and proteomics analysis
Resumo
For many high-dimensional data a common goal is to test thousands of
features against some null hypothesis. This simultaneous testing
problem has been studied extensively over the last decade in the
context of continuous microarray data. However, little attention has
been given to a new class of data that are arising in several fields,
including Genomics, Epigenomics, and Proteomics. These data, so called
Next Generation Sequencing Data, are measured at a much higher
resolution than regular microarray data and are not continuous
but rather come in the form of counts or proportions. For
these data new methods are needed to discover features that show a
statistical difference across conditions. To address this need, we have
developed a three groups mixture model, which can be applied to data
that follow distributions in the exponential dispersion family. The
proposed model fits into a framework that we call Mixture of
Generalized Linear Mixed Models (MGLMM) and applies to a variety of
high-dimensional data. In this talk I will present the MGLMM model and
apply it to two different data sets arising in Methylation Sequencing
and Proteomics Analysis. I will also present some simulation results
that suggest a superior performance over the current methods being
employed.
2o. semestre de 2011
As palestras são realizadas no Auditório do
Laboratório de Sistemas Estocásticos (LSE), sala
I-044b, as 15:30 h, a menos que ocorra aviso em
contrário.
- 14/12 David Rohde
(UFRJ)
Título:
Learning latent
factor models with the online EM algorithm (Resumo)
- 12/12 Anders
Skrondal (Oslo) (excepcionalmente uma 2a feira)
Título:
Can biological interaction be investigated in case-control studies? (Resumo)
- 23/11 Colóquio
Inter-institucional "Modelos estocásticos e
aplicações" (excepcionalmente as
14:30 horas no
CBPF)
- Sacha Friedli (UFMG)
Percolação com uma linha de defeitos (Resumo)
- Claudia Domingues Vargas (UFRJ)
Motor cognition: neurophysiological underpinning of planning, imagining
and predicting upcoming actions
(Resumo)
- 16/11 Jon Wakefield
(Washington)
Título:
A hierarchical approach to modeling allele-specific gene expression (Resumo)
- 11/11 J. N. K. Rao
(Carleton) (excepcionalmente uma 6a feira as 13:30 horas)
Título:
Robust small area estimation (Resumo)
- 09/11 Enrique Andjel
(IMPA)
Título:
Percolação de primeira passagem e
estratégias de evasão (Resumo)
- 19/10 Edilberto
Cepeda (Bogotá)
Título:
Bayesian beta regression models: extensions and aplications
- 05/10 Simon Griffiths
(IMPA)
Título:
On explosions in heavy-tailed branching random walks (Resumo)
- 21/09 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente as
14:00 horas na
UFF)
- Valderio A. Reisen (UFES)
Robust estimation in time series, unit root test based on ranks and
counting process (Resumo)
- Enrique D. Andjel (Provence)
O teorema ergódico subaditivo e suas
aplicações (Resumo)
- 11/08 Colóquio
institucional (excepcionalmente as 14:30 horas)
- Luiz Raul Pericchi (Puerto Rico)
Limiting the shrinkage for the exceptional: the Clemente
problem (Resumo)
- Omiros Papaspiliopoulos (Pompeu
Fabra)
Nonparametric estimation of diffusions: a differential equations
approach (Resumo)
- 27/07 Petros
Dellaportas (Atenas)
Título:
Control variates in reversible MCMC samplers (Resumo)
Resumos
das palestras do 2o semestre de 2011
Palestrante: David Rohde
Título: Learning
latent factor models with the online EM algorithm
Resumo
Latent factor models are a general class of graphical model with wide
applications in to name a few examples topic modelling, recomender
systems and signal processing.
In this talk I will talk about this class of model and discuss how
fully
Bayesian and semi-Bayesian approaches benefit from the exponential
family
representation. Finally I will talk about my recent work applying the
online EM algorithm to this class of problem.
Palestrante: Anders Skrondal
Título:
Can biological interaction be investigated
in case-control studies?
Resumo
It is argued by prominent epidemiologists that assessment of
interaction should be based on departures from additive rates or risks.
Unfortunately, in case-control studies the corresponding "fundamental
interaction parameter" can usually not be estimated. To overcome this
problem, epidemiologists have proposed surrogate measures of
interaction based on relative risks from logistic models. In this talk
we investigate the performance of these measures in practice, where
covariates must be included to control for confounding. We uncover two
fundamental problems with the advocated approach and suggest an
approach that rectifies the problems.
Palestrante: Claudia Domingues Vargas
Título:
Motor cognition: neurophysiological
underpinning of planning, imagining and predicting upcoming actions
Resumo
Motor systems are exquisitely adapted to transform an action goal into
the production of a movement of greatest fit in a given context. This
transformation, called motor planning, is thought to be performed
through internal models of actions. These models operate by
continuously monitoring the motor output and by making future
predictions of changes in body states and of the immediate environment.
Because of the delays inherent to sensorimotor processing, the ability
to predict the future state of the motor system in a variable
environment (context) is considered crucial to create efficient
movements and appropriate behaviors. In this colloquium I intend to
explore how the brain activity associated with motor planning changes
as a function of the context in which this movement shall be performed.
Furthermore, I will present results showing that lesions in specific
brain regions can affect the capacity of making predictions of one's
own and/or of other's upcoming actions.
Palestrante: Sacha Friedli
Título:
Percolação com uma
linha de defeitos
Resumo
É bem conhecido que em sistemas subcríticos a
correlação entre pontos distantes descresce
exponencialmente com a distância. Nesta palestra
consideraremos o processo de percolação de
Bernoulli, em que elos da rede cúbica são
independentemente abertos com probabilidade p, e fechados com
probabilidade 1-p. Introduziremos uma linha de defeitos em que os elos
são abertos com probabilidade p' < p, e estudaremos o
efeito de p' e da dimensão sobre o decaimento exponencial da
fase subcrítica. Em particular pretendemos apresentar (de
maneira não-técnica) a origem da
influência de p' e a sua conexão com as
propriedades de recorrência/transiência de um
passeio aleatório com incrementos independentes.
Palestrante: Jon Wakefield
Título:
A hierarchical
approach to modeling allele-specific gene expression
Resumo
Variation in gene expression is thought to make a significant
contribution to phenotypic
diversity among individuals within populations. We measured
allele-specific gene expression (ASE) in a diploid hybrid of two
diverse Saccharomyces cerevisiae strains using RNA-Seq. To capitalize
on the wealth of information contained in RNA-Seq data sets, we
developed a powerful and flexible hierarchical Bayesian model that
combines information across loci to allow both global and
locus-specific inferences about ASE. We show that we are able to
accurately quantify levels of ASE with specified false discovery rates,
achieving high reproducibility between independent sequencing
platforms. A key feature of the model is the use of additional genomic
DNA data to calibrate the null model. We pinpoint loci that show
unusual and biologically interesting patterns, including
allele-specific alternative splicing and allele-specific transcription
start sites.
Joint work with Dan Skelly and Josh Akey.
Palestrante: J. N. K. Rao
Título:
Robust small area
estimation
Resumo
A subpopulation or domain is called a small area if the area-specific
sample size is small or even zero. Traditional area specific direct
estimators of means are not suited for small areas and it is necessary
to use indirect estimators that borrow strength across related areas.
Small area estimation has been extensively studied under linking models
based on linear mixed models. Empirical best linear unbiased prediction
(EBLUP) estimators of small area means have been developed along with
nearly unbiased estimators of mean squared errors. However, EBLUP
estimators can be sensitive to outliers. In this talk, I will first
present a robust EBLUP type method for small area estimation and
demonstrate its advantage over the customary EBLUP under unit level
nested error linear regression models in the presence of outliers in
the random small area effects and/or unit level errors. I will also
study a bootstrap method of estimating the mean squared error of the
robust EBLUP type estimator. Secondly, I will relax the assumption of
linear regression model for the fixed part of the linear mixed model
and replace it by the weaker assumption of a penalized-spline
regression model and develop robust EBLUP type estimators of small area
means in the presence of outliers in the random small area effects and
/or unit level errors. I will also discuss bootstrap estimators of mean
squared error. Simulation results and applications to real data will
also be presented.
Palestrante: Enrique Andjel
Título:
Percolação de
primeira passagem e estratégias de evasão
Resumo
Consideramos o modelo de percolacao de primeira passagem em Z^d dado
por v.a. i.i.d. de distribuição F. Sejam
t_{\pi}(u,v) o tempo pra
passar de u a v pelo caminho \pi e t(u,v) o minimo destes tempos
considerando todos os caminhos de u a v. Perguntamos se existe pontos x
e y e um caminho semi-infinito \pi=(y_0=y,y_1,...) tal que
t_{\pi}(y,y_{n+1})
Palestrante: Simon Griffiths
Título: On explosions in heavy-tailed branching
random walks
Resumo
Consider a branching random walk on the real numbers, with offspring
distribution Z and non-negative displacement distribution W. We say
that explosion occurs if an infinite number of particles may be found
within a finite distance of the origin. In this talk, we discuss the
problem of characterising pairs (Z, W) for which explosion occurs a.s.
In particular, in the case that the offspring distribution Z has a
sufficiently heavy tail we give a necessary and sufficient condition on
W for explosion to occur. Furthermore, we demonstrate that our
condition on the tail is best possible for this equivalence to occur.
Joint with Omid Amini, Luc Devroye and Neil Olver.
Palestrante: Enrique D. Andjel
Título: O teorema ergódico subaditivo e
suas aplicações
Resumo
O teorema ergódico subaditivo foi inicialmente provado por
Kingman. Ele dá condições suficientes
para
convergência quase certa de X_n/n onde {X_n} é uma
sequência subaditiva de variáveis
aleatórias.
Veremos como uma versão um pouco mais geral deste teorema
permite deduzir resultados de interesse para a
percolação
de primeira passagem e para alguns sistemas de partículas
unidimensionais, como o processo de contato ou o processo de
exclusão.
Palestrante: Valderio A. Reisen
Título:
Robust estimation in time series, unit root
test based on ranks and
counting process
Resumo
In this talk the following research topics will be discussed.
Robust estimation: It is well-known that the sample autocovariance is
not robust to the presence of additive outliers. Hence, the definition
of an autocovariance estimator which is robust to additive outlier can
be very useful for time-series modeling. The robust autocovariance
estimator proposed by Ma and Genton (2000) is studied and applied to
time series with different correlation structures such as short and
long memory. Based on the robust autocorrelation function, a robust
estimator of the parameter d in ARFIMA(p, d, q) is proposed. Some
simulations are used to support the use of this method when a time
series has additive outliers.
DF unit root test based on ranks: In this subject, the classical
Dickey-Fuller (DF) test will be studied in the context of unit root
time series with outliers. Based on the ranks of the observations, a
robust DF test is proposed. The test is robust against outliers
observations. The asymptotic distribution of the test is obtained.
Counting process: The Integer-valued Autoregressive Moving Average
(INARMA) models have suggested modeling observed count time series.
This research is concerned with the problem of modeling INAR processes
under seasonal, unit root and long memory properties.
Palestrante: Omiros Papaspiliopoulos
Título:
Nonparametric estimation of diffusions: a differential equations
approach
Resumo
We consider estimation of scalar functions which determine the dynamics
of diffusion processes. It has been recently shown that nonparametric
maximum likelihood is ill-posed in this context. We adopt a
probabilistic approach to regularize the problem by the adoption of a
prior distribution for the unknown functional. A Gaussian prior measure
is specified in the function space by means of its precision operator,
which is defined as an appropriate differential operator. We establish
that a Bayesian Gaussian conjugate analysis for the drift of
one-dimensional non-linear diffusions is feasible given high-frequency
data. This is achieved by expressing the log-likelihood as a quadratic
function of the drift, with sufficient statistics given by the
so-called local time process and the end points of the observed path.
Computationally efficient posterior inference is carried out using a
finite element method.
We embed this technology in partially observed situations and adopt a
data augmentation approach whereby we iteratively generate missing data
paths and draws from the unknown functional. Our methodology is applied
to estimate the drift of models used in molecular dynamics and
financial econometrics using high and low frequency observations. We
discuss extensions to other partially observed schemes and connections
to other types of non-parametric inference.
Joint work with Yvo Pokern (UCL), Gareth O. Roberts (Warwick) and
Andrew M. Stuart (Warwick)
Palestrante: Luiz Raul Pericchi
Título:
Limiting the shrinkage for the exceptional: the Clemente problem
Resumo
Modern Statistics is made of the sensible combination of direct
evidence (the data directly
relevant or the "individual data") and indirect evidence (the data and
knowledge indirectly
relevant or the "group data"). The admissible procedures are a
combination of the two
sources of information, and the advance of technology is making
indirect evidence more
substantial and ubiquitous. It has been pointed out however, that in
"borrowing strength"
a fundamental problem of Statistics is to treat in a fundamentally
different way exceptional
cases, cases that do not adapt to the central "aurea mediocritas". This
is what has been
recently coined as "the Clemente problem", Efron (2010). In this
article we put forward
that the problem is caused by the simultaneous use of square loss
function and conjugate
(light tailed) priors which is the usual procedure. We propose in their
place to use robust
penalties, in the form of losses that penalize more severely huge
errors, or (equivalently)
priors of heavy tails which make more probable the exceptional. Using
heavy tailed prior
we can reproduce in a Bayesian way, Efron and Morris' "limited
translated estimators" (with
Double Exponential Priors) and "discarding priors estimators" (with
Cauchy-like priors)
which discard the prior in the presence of conflict. Both Empirical
Bayes and Full Bayes
approaches are able to alleviate the Clemente Problem and furthermore
beat the James-
Stein estimator in terms of smaller square errors, for sensible Robust
Bayes priors. We
model in parallel Empirical Bayes and Fully Bayesian hierarchical
models, illustrating that
the differences among sensible versions of both are minute, as compared
with the effect due
to the robust assumptions. We also propose a heavy tailed Beta2
distribution for variances
that arises naturally as an alternative to the usual Inverted-Gamma
distribution. This adds
stability and robustness, and strickenly produce a marginal for the
location, which is the first
known "Horseshoe" (optimal) prior in closed analytical form. This has
been put recently to
the test Fuquene, Perez and Pericchi (2011) in a Dynamical Bayesian
model for detection of
structural changes and outliers.
Palestrante: Petros Dellaportas
Título: Inferência Bayesiana em um modelo
Control variates in reversible MCMC samplers
Resumo
A general methodology is presented for the construction and effective
use of control variates for reversible MCMC samplers. The values of the
coefficients of the optimal linear combination of the control variates
are computed, and adaptive, consistent MCMC estimators are derived for
these optimal coefficients. All methodological and asymptotic arguments
are rigorously justified. Numerous MCMC simulation examples from
Bayesian inference applications demonstrate that the resulting variance
reduction can be quite dramatic.
1o. semestre de 2011
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 06/07 Caio L. N.
Azevedo (UNICAMP)
(excepcionalmente no Auditório do LSE, sala
I-044b)
Título: Inferência
Bayesiana em um modelo TRI com distribuição
normal assimétrica centralizada para os traços
latentes (Resumo)
- 29/06 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (no Auditório do LSE, bloco I-044b
do CT,
às
13:30 horas)
- Constantino Tsallis (CBPF)
Título: Conexões entre sistemas
dinâmicos
não lineares e entropia quando o máximo expoente
de
Lyapunov é zero (Resumo)
- Dani Gamerman (UFRJ)
Título: Space-time modelling of coupled spatio-temporal
environmental variables (Resumo)
- 15/06 Edilson
Fernandes de Arruda (COPPE-UFRJ)
Título: Processos
de Decisão Markovianos: Algoritmos Aproximados e
Aceleração de Convergência (Resumo)
- 25/05 Marco Ferreira
(Missouri)
Título: Dynamic
multiscale spatio-temporal models for Gaussian areal data (Resumo)
- 18/05 A.
Gaudilliere
(LATP, Marselha)
Título: Markovian
convergence
to equilibrium: the metastable case (Resumo)
- 04/05 Hugo de la Cruz
(IMPA)
Título: Simulation
of stochastic differential equations (Resumo)
- 20
/04 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (no Auditório 1, IMPA, às 14:00 horas)
- Leonardo T. Rolla (IMPA)
Título: Métodos gráficos para sistemas
de partículas (Resumo)
- Thaís C. O. Fonseca (UFRJ)
Título: Modelos espaço-temporais não
gaussianos (Resumo)
- 13/04 Rui Martins
(Lisboa)
Título: Análise
conjunta Bayesiana de dados longitudinais e de sobrevivência (Resumo)
- 06/04 Emily Fox (Duke)
Título: Bayesian
nonparametric methods for complex dynamical phenomena (Resumo)
- 23/03 Abel Rodriguez
(Santa Cruz, EUA)
Título: Dirichlet
process mixtures (Resumo)
Resumos
das palestras do 1o semestre de 2011
Palestrante: Caio L. N. Azevedo
Título: Inferência Bayesiana em um modelo
TRI com distribuição normal
assimétrica centralizada para os traços latentes
Resumo
Neste trabalho desenvolvemos um algoritmo MCMC para estimar os
parâmetros de um modelo TRI com
distribuição normal assimétrica
centralizada para os
traços latentes, proposto por Azevedo, Bolfarine e Andrade
(2011). Consideramos uma representação
estocástica bastante utilizada para a
distribuição
normal assimétrica, a fim de facilitar o desenvolvimento e
implementação do referido algoritmo. Mecanismos
de verificação e validação
do modelo são
desenvolvidos, também no contexto Bayesiano. Estudos de
simulação indicam que o algoritmo desenvolvido
estima tão bem ou melhor os parâmetros, em
relação ao algoritmo desenvolvido anteriormente
por Azevedo, Bolfarine e Andrade (2011), em diversas
situações. Além disso, o algoritmo
proposto no
presente trabalho é mais rápido que seu
predecessor. Um conjunto de dados da área educacional
é analisado para ilustrar a metodologia, algoritmo de
estimação e ferramentas de
validação do modelo, desenvolvidos.
Palestrante: Dani Gamerman
Título: Space-time modelling of coupled
spatio-temporal environmental variables
Resumo
We propose a dynamic factor model for spatio-temporal coupled
environmental variables. The model is discussed in a state-space
framework which is useful for interpolation and forecast of the
variable of interest. The role of the measurement matrix in spatial
interpolation is considered and the proposal of its stochastic
specification is discussed. Full probabilistic inference for the model
parameters is facilitated by Markov chain Monte Carlo (MCMC)
algorithms. Standard MCMC for dynamic linear models are adapted to our
model specification and predictive results are discussed for two
different data sets with variables measured at two different scales.
Palestrante: Constantino Tsallis
Título: Conexões
entre sistemas dinâmicos não lineares e entropia
quando o
máximo expoente de Lyapunov é zero
Resumo
Os sistemas dinâmicos não lineares fortemente
caoticos se
acomodam naturalmente com conceitos tais como a entropia de
Boltzmann-Gibbs-Shannon, e consequentemente com a produçao
de
entropia de Kolmogorov-Sinai, a identidade de Pesin,
distribuições Gaussianas, o teorema do limite
central,
transformada de Fourier, etc. Já o caso dos sistemas
fracamente
caoticos, mais precisamente cujo maximo expoente de Lyapunov
é
zero, é bem mais sutil. Faremos uma breve
descrição de como uma entropia não
aditiva que
generaliza a tradicional permite tratar tais sistemas muito
satisfatoriamente. Predições,
verificações
e aplicaçoes em sistemas naturais, artificiais e sociais
serão mencionadas também. Alguns problemas
abertos que
muito beneficiariam de rigor matemático serão
apontados.
Palestrante: Edilson
Fernandes de Arruda
Título: Processos
de Decisão Markovianos: Algoritmos Aproximados e
Aceleração de Convergência
Resumo
Apresentam-se algumas propostas de solução
aproximada de processos de decisão markovianos em problemas
de grande escala, desenvolvidas em trabalhos com co-autoria do
palestrante. Para os casos em que é possível
obter a solução exata, é apresentada
uma técnica de aceleração de
convergência de algoritmos lineares, aplicada ao algoritmo de
iteração de valor. A referida técnica
pode reduzir consideravelmente o tempo de convergência em
relação ao algoritmo tradicional de
iteração de valor.
Palestrante: Marco
Ferreira
Título: Dynamic
multiscale spatio-temporal models for Gaussian areal data
Resumo
We introduce a new class of dynamic multiscale models for
spatio-temporal processes arising from Gaussian areal data.
Specifically, we use nested geographical structures to decompose the
original process into multiscale coefficients which evolve through time
following state-space equations. Our approach naturally accommodates
data observed on irregular grids as well as heteroscedasticity.
Moreover, we propose a multiscale spatio-temporal clustering algorithm
that facilitates estimation of the nested geographical multiscale
structure. In addition, we present a singular forward filter backward
sampler for efficient Bayesian estimation. Our multiscale
spatio-temporal methodology decomposes large data-analysis problems
into many smaller components and thus leads to scalable and highly
efficient computational procedures. Finally, we illustrate the utility
and flexibility of our dynamic multiscale framework through two
spatio-temporal applications. The first example considers mortality
ratios in the state of Missouri whereas the second example examines
agricultural production in Espírito Santo State Brazil.
Palestrante: A. Gaudilliere
Título: Markovian
convergence
to equilibrium: the metastable case
Resumo
We will discuss how some mathematical modelization of metastable
phenomenology make available new techniques to control relaxation time
and mixing time of a large class of slow mixing Markov chains. In
particular one can give sharp asymptotics of the spectral gap and
control mixing times up to a constant factor by estimating quantities
that satisfy a two-sided variational principle. To derive this kind of
estimates we extend the notion of quasi-stationary measures to that of
soft measures, which interpolate between the usual quasi-stationary
measure and the so-called restricted ensemble that appears in the first
mathematically rigorous studies of the metastable phenomenon. We also
use potential theoretical tools to extend the usual notion of capacity
between sets in order to get a new general and practical
Poincaré inequality that gives the correct relaxation time
asymptotic in "metastable cases".
This talk is based on a joint work with Alessandra Bianchi.
Palestrante: Thaís C.
O. Fonseca
Título:
Modelos espaço-temporais não gaussianos
Resumo
Nesse trabalho construímos processos não
gaussianos que possuem função de
covariância não separável no
espaço-tempo. O modelo não gaussiano é
obtido através de misturas na escala, resultando em
processos capazes de acomodar tanto observações
aberrantes como regiões com variabilidade diferente das
demais. Essa flexibilidade é obtida por dois tipos de
mistura: um processo que varia suavemente e um outro não
correlacionado. Métodos de Monte Carlo por Cadeias de Markov
são utilizados para inferência e
previsão. Uma aplicação em dados de
temperatura na Espanha ilustram o potencial dessa classe de modelos e o
ganho no desempenho preditivo.
Palestrante: Leonardo T.
Rolla
Título: Métodos
gráficos para sistemas de partículas
Resumo
Consideramos dois tipos de construções
gráficas amplamente utilizadas em processos espaciais
aleatórios, principalmente sistemas de spin e de
partículas interagentes. Começamos pelo chamado
``acoplamento básico'', baseado em pontos de Poisson. Depois
descrevemos uma construção baseada em uma rede de
agentes distribuídos, onde o sistema é visto como
uma seqüência bem comportada de
operações ao invés de uma
evolução em tempo contínuo. Em seguida
vamos discutir algumas aplicações de cada
construção em diferentes
situações, e finalmente explicar seu uso no
estudo de transição de fase em modelos
estacionários de criticalidade auto-organizada.
Palestrante: Rui Martins
Título: Análise
conjunta Bayesiana de dados longitudinais e de sobrevivência
Resumo
A análise conjunta de dados longitudinais e de
sobrevivência tem tido grande atenção
nos últimos anos, sobretudo para dados relativo à
SIDA. Inicialmente, este tipo de dados era analisado considerando o
tempo até ao evento (dados de sobrevivência) e as
medidas repetidas (dados longitudinais) de cada indivíduo
separadamente. Como ambos os tipos de dados são observados
no mesmo indivíduo, a modelação
conjunta dos dados longitudinais e de sobrevivência
é mais apropriada, porque tem em conta as
dependências entre os dois tipos de respostas (Henderson et
al. 2000). Guo e Carlin (2004) abordam a questão da
análise conjunta propondo um modelo bayesiano
hierárquico, cujas estimativas dos parâmetros de
interesse são obtidas com base em métodos de
Monte Carlo via cadeias de Markov (MCMC). Iremos aqui utilizar a
abordagem de Guo e Carlin pra modelar conjuntamente dados longitudinais
e de sobrevivência para um grupo de pacientes com VIH/SIDA no
Brasil. Além disso, incluiremos efeitos
aleatórios espacialmente correlacionados para captar a
heterogeneidade não observável entre
indivíduos de diferentes estados brasileiros.
Concluímos que a análise conjunta bayesiana
apresenta consideráveis melhorias na
distribuição do tempo de sobrevivência
mediano quando comparado com a obtida pelas análises em
separado.
Palestrante: Emily Fox
Título: Bayesian
Nonparametric Methods for Complex Dynamical Phenomena
Resumo
Background on switching Markov
processes
HDPs for hidden Markov modeling with state persistence
- application: speaker diarization
HDPs for switching autoregressive and switching linear dynamical
processes
- applications: honey bees dances, stochastic volatility
Beta processes for jointly modeling multiple time series
- background on beta process and Indian buffet process
- application: motion capture videos
Palestrante: Abel
Rodriguez
Título: Dirichlet process
mixtures
Resumo
Motivating examples.
A quick review of finite mixture modeling.
The Dirichlet process mixture model.
Fitting a DP mixture model: Collapsed samplers.
Examples.
Hyperparameter estimation/ Examples revisited.
2º semestre de 2010
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 15/12 Hedibert F.
Lopes (Chicago)
Título: Parsimonious Bayesian factor analysis when
the number of factors is unknown (Resumo)
- 17/11 Amy Wu (York,
Canadá)
Título: An M-estimation-based
simultaneous change point analysis and variable selection in a
regression problem (Resumo)
- 24/11 Reunião
entre Alunos e Corpo Docente
- 17/11 Nancy Garcia
(Unicamp) (excepcionalmente as 13:30 h)
Título: Como encontrar o caminho otimo
para veiculos autonomos baseados em leituras markovianas
(Resumo)
- 10/11 Flavio
Gonçalves (UFJF)
Título: Exact simulation and Bayesian
inference for jump-diffusion processes (Resumo)
- 27/10 Alexandre
Patriota (USP)
Título: Modelo VAR para testar a
causalidade de Granger quando as variáveis envolvidas
estão sujeitas a erros de medição
(Resumo)
- 13/10 Eliane
Rodrigues (UNAM)
Título: Alguns modelos de volatilidade
estocástica aplicados aos dados de ozônio da rede
de monitoramente da Cidade do México (Resumo)
- 06/10 V. Mandrekar
(Michigan)
Título: Recurrence properties of solutions in
interest rate models (Resumo)
- 29/09 John W. Emerson
(Yale)
Título: The Bigmemory Project (Resumo)
- 22/09 Matthieu
Lerasle (USP)
Título: Data-driven penalties in model selection (Resumo)
- 15/09 Alexander
Valencia (USP)
Título: The radial Brownian web (Resumo)
- 08/09 Jim Smith
(Warwick) (excepcionalmente as 11:00 h)
Título: How robust is parametric Bayesian inference? (Resumo)
- 01/09 Ralph
S. Silva (UFMG)
Título: Auxiliary
particle filtering within adaptive Metropolis-Hastings sampling (Resumo)
- 11/08 Eric
Cator (Delft)
Título: Estimating
a monotone regression function (Resumo)
Resumos
das palestras do 2º semestre de 2010
Palestrante: Hedibert F.
Lopes
Título: Parsimonious
Bayesian factor analysis when the number of factors is unknown
Resumo
We
introduce a new and general set of identifiability conditions for
factor models which handles the ordering problem associated with
current common practice. In addition, the new class of
parsimonious Bayesian factor analysis leads to a factor loading matrix
representation which is an intuitive and easy to implement factor
selection scheme. We argue that the structuring the factor
loadings matrix is in concordance with recent trends in applied factor
analysis. Our MCMC scheme for posterior inference makes
several improvements over the existing alternatives while outlining
various strategies for conditional posterior inference in a factor
selection scenario. Four applications, two based on synthetic data and
two based on well known real data, are introduced to illustrate the
applicability and generality of the new class of parsimonious factor
models, as well as to highlight features of the proposed sampling
schemes. We want to discuss the advantages of some resampling penalties
in a general density estimation framework. We will see how they can be
calibrate when the data are independent, or at least mixing. We will
also discuss the slope heuristic and justify that it can also be used
in a non necessarily independent framework. We obtain for all these
methods asymptotically optimal oracle inequalities under a few
conditions on the collections of models.
Palestrante: Amy Wu
Título: An M-estimation-based
simultaneous change point analysis and variable selection in a
regression problem
Resumo
In this talk, an
M-estimation-based criterion is proposed for carrying out change point
analysis and variable selection simultaneously in linear models with a
possible change point. Under some weak conditions, this criterion is
shown to be strongly consistent in the sense that with probability one,
it chooses the smallest true model for large sample size. Its
byproducts include consistent estimates of the regression coefficients
regardless if there is a change point. In case that there is a change
point, its byproducts also include a consistent estimate of the change
point parameter. In addition, an algorithm is given which has
significantly reduced the computation time needed by the proposed
criterion for the same precision. Data examples are also presented,
which include results from a simulation study and a real data example.
Based on a joint work with Prof. Rao and Mr. Shi.
Palestrante: Nancy Garcia
Título: Como encontrar o caminho otimo
para veiculos autonomos baseados em leituras markovianas
Resumo
O DARPA Grand Challenge eh uma
competicao na qual veiculos autonomos tem que completar uma rota de 300
milhas repleta de obstaculos. Os veiculos tem que completar o trajeto
de forma completamente autonoma sem nenhuma influencia externa. Nosso
artigo tem como inspiracao este problema, mas trabalha somente em uma
pequena parte do
problema. Neste trabalho propomos um algoritmo eficiente para encontrar
a trajetoria suave mais curta entre dois pontos evitando obstaculos
colocados. Os obstaculos sao medidos atraves de um mecanismo markoviano
que
corrige o sensor utilizando a medicao anterior atraves de um filtro de
Kalman.
Palestrante: Flavio B.
Gonçalves
Título: Exact simulation and Bayesian
inference for jump-diffusion processes
Resumo
The last 10 years have seen a
large increase in statistical methodology for diffusions, and
computationally intensive Bayesian methods using data augmentation have
been particulary prominent. This activity has been fuelled by existing
and emerging applications in economics, biology, genetics, chemistry,
physics and engineering. However diffusions have continuous sample
paths so may natural continuous time phenomena require more general
classes of models. Jump-diffusions have considerable appeal as exible
families of stochastic models. Bayesian inference for jump-diffusion
models motivates new methodological challenges, in particular requires
the construction of novel simulation schemes for use within data
augmentation algorithms and within discretely observed data. In this
paper we propose a new methodology for exact simulation of
jump-diffusion processes. Such method is based on the recently
introduced Exact Algorithm for exact simulation of diffusions. We also
propose a simulation-based method to make likelihood-based inference
for discretely observed jump-diffusions in a Bayesian framework.
Simulated examples are presented to illustrate the proposed methodology.
Palestrante: Alexandre
Patriota
Título: Modelo VAR para testar a
causalidade de Granger quando as variáveis envolvidas
estão sujeitas a erros de medição
Resumo
Este estudo apresenta estimadores
consistentes para os parâmetros de um modelo autoregressivo
vetorial sujeito a erros de medição. A
distribuição assintótica dos
estimadores é derivada. No caso de dados com erros de
medida, os métodos existentes na literatura não
podem ser utilizados, pois sob a hipótese nula
(não-causalidade de Granger) o modelo se torna
não-identificável. Conduzimos estudos de
simulação que indicam uma interferência
drástica do erro de medição nas
conclusões dos testes de hipóteses. O
método é aplicado a dados de fMRI (functional
magnetic resonance imaging), para detectar os fluxos de
informação entre regiões cerebrais.
Trabalho conjunto com João R. Sato (Federal do ABC) e
Betsabé G. Blas Achic (UFPE).
Palestrante: Eliane
Rodrigues
Título: Algunos modelos de volatilidade
estocástica aplicados aos dados de ozônio da rede
de monitoramente da Cidade do México
Resumo
Apresentaremos alguns modelos
bivariados de volatilidade estocástica comumente utilizado
no estudo de series de tempo em finanças. Estes modelos
serão aplicados às médias semanais de
máximos diários de ozônio da Cidade do
México. Os modelos serão utilizados para analisar
os dados de pares de regiões nas quais a cidade esta
dividida. Estes resultados foram obtidos conjuntamente com Jorge. A.
Achcar e Henrique C. Zozolotto.
Palestrante: V. Mandrekar
Título: Recurrence properties of
solutions in interest rate models
Resumo
We show the stability and ultimate
boundedness (in mean square sense) of well known financial models for
interest rates. As a consequence we derive the existence of invariant
measure and recurrence properties of these solutions. The main
technique involves the use of Lyapunov function methods developed by R.
Khasminskii and Y. Miahara.
Palestrante: John W. Emerson
Título: The Bigmemory Project
Resumo
Multi-gigabyte data sets challenge
and frustrate R users even on well-equipped hard-ware. Use of C/C++ can
provide efficiencies, but is cumbersome for interactive data analysis
and lacks the flexibility and power of R’s rich statistical
programming environment. The package bigmemory and its sister packages
biganalytics, synchronicity, and
bigalgebra bridge this gap, implementing massive matrices and
supporting their basic manipulation and exploration. The data
structures may also be file-backed, allowing users to more easily
manage and analyze data sets larger than available RAM and potentially
share them across nodes of a cluster. These features of the Bigmemory
Project open the
door for powerful and memory-efficient parallel analyses and data
mining of massive data sets.
Palestrante: Matthieu
Lerasle
Título: Data-driven
penalties in model selection
Resumo
In
this talk, we want to discuss the advantages of some resampling
penalties in a general density estimation framework. We will see how
they can be calibrate when the data are independent, or at least
mixing. We will also discuss the slope heuristic and justify that it
can also be used in a non necessarily independent framework. We obtain
for all these methods asymptotically optimal oracle inequalities under
a few conditions on the collections of models.
Palestrante: Alexander
Valencia
Título: The radial Brownian web
Resumo
The Brownian Web (BW) is a family
of coalescing Brownian motion starting from every point in space time
RxR. In this work, we consider a set A of fixed points belonging to
circles of radio k, k=1,2,...,n where n is a non negative integer
number. Then, we consider a family of coalescing random walks starting
from A. After diffusive scaling we obtain the convergence in
distribution of this coalescing random walk to what we call "The Radial
Brownian Web" on a metric space which is the restriction of the metric
space where the "usual" BW takes its values.
Palestrante: Jim Smith
Título: How robust is parametric Bayesian inference?
Resumo
Since
MCMC algorithms have been available there has been an explosion of
applications using parametric Bayesian statistical models. These of
course need prior probabilistic inputs to run, but various ways of
setting default priors have been advanced which at least appear to
stabilize the numerical algorithms. But to what extent can we believe
that the ensuing inferences are reliable and are not too sensitive to
the way we initialize this process? In this talk I will demonstrate
that however much data we collect there are some aspects of typical
Bayesian models we can never learn about. So inference about these
quantities just reflects the prior we choose. On the other hand,
provided we are careful it is straightforward to demonstrate that,
under broad assumptions many types of inference are robust. Indeed
simple bounds can be calculated, based on the values of typical
summaries calculated from numerical methods which reflect how different
inferences would be, given different candidate priors. The talk will be
illustrated throughout by familiar examples. This is a joint work with
Fabio Rigat and Ali Daneshkhah.
Palestrante: Ralph S.
Silva
Título: Auxiliary
particle filtering within adaptive Metropolis-Hastings Sampling
Resumo
Our
article deals with Bayesian inference for a general state space model
with the simulated likelihood computed by the particle filter. We show
empirically that the partially or fully adapted particle filters can be
much more efficient than the standard particle filter, especially when
the signal to noise ratio is high. This is especially important because
using the particle filter within Markov chain Monte Carlo sampling is
O(T2), where T is the sample size. We also show that an adaptive
independent Metropolis Hastings proposal for the unknown parameters
based on a mixture of normals can be much more efficient than the usual
optimal random walk methods because the simulated likelihood is not
continuous in the parameters and the cost of constructing a good
adaptive proposal is negligible compared to the cost of evaluating the
simulated likelihood. Independent Metropolis-Hastings proposals are
also attractive because they are easy to run in parallel on multiple
processors. The article also shows that the proposed adaptive
independent Metropolis Hastings sampler converges to the posterior
distribution. We also show that the marginal likelihood of any state
space model can be obtained in an efficient and unbiased manner by
using the particle filter making model comparison straightforward.
Obtaining the marginal likelihood is often difficult using other
methods. Finally, we prove that the simulated likelihood obtained by
the auxiliary particle filter is unbiased. This result is fundamental
to using the particle filter for Markov chain Monte Carlo sampling.
Palestrante: Eric Cator
Título: Estimating a monotone regression function
Resumo
When modeling the effect of a covariate X
on
a dependent variable Y, in many practical cases it can be natural
to
assume a monotone relationship between Y and X. In this talk, we will
study
an estimator that only assumes this monotonicity, and not any other
parametric form of the regression function. We will consider the local limit
behavior of this non-parametric estimator and present a theorem about its
adaptivity and local optimality.
1º semestre de 2010
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 14/07 Giovani L.
Silva (IST, Lisboa)
Título: Análise
espaço-temporal de fogos florestais em Portugal (Resumo)
- 16/06 Marcelo
Hilário (IMPA)
Título:
Fixação e não
conservação em processos de
aglomeração distribuida (Resumo)
- 02/06 Daniel Y.
Takahashi (USP)
Título:
Identifying the interaction graph of an infinite range Ising model (Resumo)
- 26/05 Eliane
Rodrigues (UNAM) (excepcionalmente na sala B110)
Título:
Modelos Markovianos aplicados a estudos de
poluição atmosférica (Resumo)
- 12/05 Alexsandro G.
G. Gallo (Unicamp)
Título:
Cadeias de alcance variável e esquema regenerativo (Resumo)
Resumos
das palestras do 1º semestre de 2010
Palestrante: Giovani L. Silva
Título: Análise
espaço-temporal de fogos florestais em Portugal
Resumo
Na
última década, os incêndios florestais
tornaram-se uma grave catástrofe natural em Portugal. O
elevado número de ocorrências de fogos e a sua
severidade provocam grande devastação levando a
elevados prejuízos, quer económicos quer
ambientais, e colocando em risco bens, populações
e a subsistência da própria floresta. Neste
trabalho apresentam-se modelos hierárquicos bayesianos para
analisar dados espaço-temporais relativos à
proporção de área ardida em Portugal
continental por concelho/municípios ao longo das
últimas três décadas. Mistura de
distribuições foi usada para modelar
conjuntamente a proporção de área
ardida e o excesso de concelhos sem área ardida ao longo dos
anos em estudo. Na obtenção das estimativas a
posteriori dos parâmetros de interesse, usaram-se
métodos de Monte Carlo viacadeias de Markov (MCMC).
Palestrante: Marcelo
Hilário
Título:
Fixação e não
conservação em processos de
aglomeração distribuida
Resumo
Consideramos um algoritmo em que,
inicialmente, cada sítio da rede Euclidiana Z^d recebe uma
quantidade inicial de um dado recurso e, a cada passo, os
vértices mais ricos atraem os recursos localizados sobre os
seus vizinhos menos ricos. Essa evolução
dá origem a um processo de
agloremação. Mostraremos que, se a
distribuiçãos inicial é invariante por
translação, o fluxo ao redor de cada
sítio cessa após um número finito de
iterações (fixação local).
Mostraremos também que existem
distribuições iniciais para as quais
não se observa conservação de recursos
ou seja, para as quais é possível que o recurso
que começa em um dado sítio continue se movendo
para sempre.
Palestrante: Daniel Y. Takahashi
Título: Identifying the
interaction graph of an infinite range Ising model
Resumo
We consider Ising models (binary,
pairwise interaction Gibbs probability measures) with an infinite
interaction graphs embeded in $\Z^d$. We address the problem of
identying pairs of points with non-null interaction based on the values
assigned to a finite set of sites in a finite sample of independent
realisations of the Ising model. Our main theorem gives an upper bound
for the probability of misidentification of interacting pairs of sites.
This is a joint work with Antonio Galves and Enza Orlandi.
Palestrante: Eliane Rodrigues
Título: Modelos Markovianos
aplicados a estudos de poluição
atmosférica
Resumo
Neste
seminário vamos apresentar um modelo Markoviano
homogêneo no tempo que registra o intervalo onde as
medições de ozônio podem pertencer a
cada unidade de tempo. Também vamos considerar um modelo
não homogêneo no tempo. Neste caso estaremos
considerando um modelo de Poisson para contar o número de
ultrapasses de uma norma ambiental em um intervalo de tempo de
interesse. A estimação dos parâmetros
envolvidos nos modelos será realizada sob o ponto de vista
Bayesiano. A aplicação dos resultados
será feita utilizando dados da rede de monitoramento
ambiental da Cidade do México. Este seminário tem
como base trabalhos conjuntos com J.A Achcar, L.J. Álvarez,
A.A Fernández-Bremauntz e G. Tzinztun.
Palestrante: Alexsandro G. G. Gallo
Título: Cadeias de alcance
variável e esquema regenerativo
Resumo
Uma
primeira (grande) parte da palestra será dedicada
à introdução das cadeias de Markov de
alcance variável. Estas cadeias têm a propriedade
de que a cada tempo, o estado escolhido depende de um sufixo do
passado, cujo tamanho (limitado) é uma
função determinística do passado. Isso
contrasta com a situação nas cadeias de Markov
genéricas, em que o alcance é fixo.
Este modelo foi introduzido em 1983 por Jorma Rissanen para
compressão de dados, e foi (re-)descoberto recentemente como
uma ferramenta poderosa para modelagem estocástica em
áreas muito diversas, tais como linguística ou
biologia, por exemplo.
A segunda parte será dedicada às cadeias de
alcance variável não limitado. Mostraremos que
sob certas condições, estas cadeias, que
são "não-markovianas" podem exibir um esquema
regenerativo.
2º semestre de 2009
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 09/12 Valentin Sisko
(UFF)
Título:
Medidas de Gibbs sobre um conjunto de grafos infinitos (Resumo)
- 24/11 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente na 3a
feira no
Auditório 1, IMPA, às
14:30 horas)
- Marzio Cassandro (Roma)
Título: Coarse graining in Statistical Mechanics and Kac
models (Resumo)
- Helio S. Migon (UFRJ)
Título: Objective Bayesian Analysis for Heteroscedastic
Regression (Resumo)
- 18/11 José
M. Bernardo (Valencia)
Título:
An objective Bayesian approach to natural induction (Resumo)
- 30/10 Dalton F.
Andrade (UFSC) (excepcionalmente na 6a. feira às
15hs.)
Título: Teoria da Resposta ao Item: principais
conceitos e suas aplicações em diferentes
áreas (Resumo)
- 14/10 Carlos A.
Abanto-Valle (UFRJ)
Título:
Bayesian
analysis of heavy-tailed stochastic volatility in mean model using
scale mixtures of normal distributions (Resumo)
- 30/09 Reunião
entre Alunos e Corpo Docente
- 23/09 Leandro
Pimentel (UFRJ)
Título:
A conjectura
da raiz cúbica (ou conjectura KPZ) para o máximo
entre somas de variáveis aleatórias
- 02/09 Apresentações
Prévias de Mestrado*
13:30 Palestrante: Kelly Cristina Mota Gonçalves
Título: Estimadores Lineares Bayesianos em
População Finita
14:00 Palestrante: Larissa de Carvalho Alves
Título: Incorporando distâncias
econômicas em modelos dinâmicos bayesianos
14:30 Palestrante: Leonardo Nassif
Título: Modelos dinâmicos matriz variados
com estrutura de grafos para construcão
e otimizacão de portfólios
15:30 Palestrante: João Batista de Morais Pereira
Título: Métodos de
estimação em modelos dinâmicos para
séries temporais de contagens
16:00 Palestrante: Thiago Guerrera Martins
Título: Aproximações
Analíticas de Distribuições a
Posteriori
16:30 Palestrante: Rodrigo Targino
Título: Aplicações do
Movimento Browniano Fracionário em Finanças
* - Cada apresentação terá
duração de 20 minutos seguida de 10 minutos de
arguição. Elas ficarão divididas em 2
blocos com intervalo de 15:00 às 15:30 hs entre eles.
- 19/08 Milton Jara
(Paris)
Título:
Sistemas de partículas em ambiente aleatório (Resumo)
- 12/08 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente no CBPF, às 13:30 horas)
- Mucio A. Continentino (CBPF)
Título:
Transições de fase quânticas
- Itzhak Roditi (CBPF)
Título:
Diferentes abordagens em campos quânticos a temperatura finita
Resumos
das Palestras do 2º semestre de 2009
Palestrante:
Valentin Sisko
Título:
Medidas de Gibbs sobre um conjunto de grafos infinitos
Resumo
Seja $\Gamma$ um subconjunto de
$\mathbb{R}^d$ localmente finito e seja $(\Gamma,E)$ o grafo completo.
Consideramos medidas de Gibbs sobre o conjunto de todos subgrafos
$(\Gamma,E')$ tais que o conjunto de elos $E'$ é subconjunto
de $E$. A interação de Gibbs atua entre cada dois
elos presentes tais que eles têm um vértice em
comum. Estudamos propriedades de percolação em
relação à medida de Gibbs em dois
casos: a) quando $\Gamma$ é uma
realização de um processo de Poisson em
$\mathbb{R}^d$. b) quando $\Gamma$ tem decaimento exponencial de
conectividade. Trabalho em colaboração com Pablo
A. Ferrari, Eugene A. Pechersky e Anatoli A. Yambartsev.
Palestrante:
Helio S.
Migon
Título:
Objective Bayesian
Analysis for Heteroscedastic Regression
Resumo
The
normality assumption is very common in many statistical problems, but
in some cases unatenable for natural phenomena due to the distribution
of the data shows a leptokurtic or a platykurtic shape and is not
robust to outliers. In order to accommodate this characteristic we
propose the use of t-Student, which reduces the influence of outliers.
Another choice is the exponential power (EP) distribution that can
provide both heavier (leptokurtic) and lighter tails (platykurtic) than
normal density.
Objective Bayesian analysis for linear heteroscedastic regression
models is developed. We derive explicit expressions for Jeffreys priors
for the model parameters and show that some of these priors lead to
proper posterior distributions. Moreover, we show that our proposed
Bayesian analysis compares favorably to frequentist analysis previously
proposed in the literature. Finally, we illustrate our methodology with
applications of the Student-t and exponential power regression models
to different datasets.
Palestrante:
Marzio Cassandro
Título:
Coarse graining in Statistical Mechanics and Kac models
Resumo
The coarse graining technique is a
mathematical device to describe the actual procedure to perform a
measure in a physical system with a very large number of degrees of
freedom. We discuss its relevance in Equilibrium Statistical Mechanics
and illustrate the application to a class of systems with long range
interactions: the Kac models.
Palestrante:
Dalton F. Andrade
Título:
Teoria da Resposta ao Item: principais conceitos e suas
aplicações em diferentes áreas
Resumo
Neste seminário
serão apresentados e discutidos os principais conceitos da
Teoria da Resposta ao Item, procurando mostrá-la como uma
poderosa ferramenta na construção e
interpretação de escalas de medida.
Serão apresentados seus diversos modelos e os principais
métodos de estimação dos
parâmetros envolvidos. Diversos exemplos com dados reais
serão apresentados, bem como tópicos de pesquisas
em andamento ou para pesquisas futuras.
Palestrante:
Carlos A. Abanto-Valle
Título:
Bayesian analysis of heavy-tailed stochastic volatility in mean model
using scale mixtures of normal distributions
Resumo
The stochastic volatility in mean (SVM)
model using the class of symmetric scale mixtures of normal (SMN)
distributions is introduced. The SMN distributions provide a robust
alternative in the absence of normality. Specific distributions
examined include the normal, Student-t, slash, variance gamma and
contaminated normal. Using a Bayesian viewpoint, an efficient method
based on Markov chain Monte Carlo (MCMC) is developed for parameter
estimation. The methods developed are applied to analyze daily stock
returns data on São Paulo Stock, Mercantile &
Futures Exchange index (IBOVESPA). Bayesian model selection criteria as
well as out-of- sample forecasting results reveal that the SVM model
with Slash distribution provides significant improvement in model fit
as well as prediction to the IBOVESPA data over the usual normal model.
This is joint work with Helio Migon and Victor Lachos.
Palestrante:
Leandro Pimentel
Título:
A conjectura da raiz cúbica (ou conjectura KPZ) para o
máximo entre somas de variáveis
aleatórias
Resumo
Neste seminário iremos
discutir o seguinte problema fundamental em teoria das probabilidades e
estatística. Suponha que { X_i : i em I } seja uma
coleção de variáveis
aleatórias i.i.d. de tamanho n. O resultado chave para a
análise estatística do funcional S_I = \sum_{i em
I} X_i é o Teorema do Limite Central, a saber: na escala
n1/2, a distribuicao de S_I − E(S_I) pode ser aproximada por
uma curva gaussiana. Outro tipo de funcional sobre variáveis
aleatórias surge naturalmente na seguinte
situação não muito distinta: suponha
que seja dado uma família de conjuntos I e que, para cada
conjunto I em I, haja também { X_i : i em I } como
anteriormente. Nesse modelo, o funcional é dado pelo
máximo entre todas as somas possiveis: LI = max_{ I em I}
S_I . A conjectura da raiz cúbica (postulada pelos
físicos Kadar, Parisi e Zhang) afirma que, para certos
modelos de percolação onde I é uma
determinada classe de caminhos sobre grafos orientados, a escala
correta para a análise estatística de L_I
− E(L_I) é n^{1/3}, onde n ~ max_{ I em I} |I|,
independentemente dos detalhes microscópicos do modelo.
Também se espera que a curva limite da
distribuição seja algo envolvendo o determinate
de Fredholm do núcleo de Airy.
Palestrante:
Milton Jara
Título:
Sistemas de partículas em ambiente aleatório
Resumo
We obtain some scaling limits for
particle systems in random environment. Examples of such scaling limits
are hydrodynamic limits, density fluctuations and asymptotics of a
tagged particle. Those limits are descibed in terms of a differential
operator L^W which in its general form is random, reflecting the
influence of the environment in the
collective behavior of the system.
1º semestre de 2009
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 29/06 Ralph S. Silva
(Sydney) (excepcionalmente na 2ª feira)
Título:
A copula
based approach to adaptive sampling (Resumo)
- 24/06 Claudio Landim
(IMPA)
Título:
Medida
estacionárias fora do equilíbrio (Resumo)
- 27/05 Alan Gelfand
(Duke)
Título:
Fusing point
and areal level space-time data with application to wet deposition (Resumo)
- 20/05 Luigi Ippoliti
(Pescara)
Título:
Supervised
classification of functional infrared imaging data for differential
diagnosis of Raynaud´s phenomenon (Resumo)
- 13/05 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente na sala
G-122 do CT, às
13:30 horas)
- Paulo M. C. Oliveira (UFF)
Título: Evolução das linguagens
faladas (Resumo)
- Marcelo Viana (IMPA)
Título: Sistemas determinísticos - uma
perspectiva estocástica (Resumo)
- 29/04 Lelys Guenni
(Caracas)
Título:
Detection of
oceanic influence on the precipitation of the central Venezuelan coast
using time-varying models (Resumo)
- 01/04 Claudia
Klueppelberg (Munique) (excepcionalmente as 13:30 h)
Título:
Estimating
high quantiles for electricity prices by stable linear models (Resumo)
- 25/03 Paulo S. Lucio
(UFRN)
Título:
Uma
alternativa computacional-Bayesiana para a
recuperação de informação
demográfica via algoritmo “EM”
(Resumo)
- 18/03 Reunião
entre Alunos e Corpo Docente
- 06/03 Abertura do Ciclo de
Palestras de 2009 (excepcionalmente às 15:00 horas)
- 15:00 Anthony
Davison (Lausanne)
Título: Geostatistics of extremes (Resumo)
- 16:00 Peter
J. Green (Bristol)
Título: Bayesian model-based clustering procedures and
application to gene expression profiles
(Resumo)
Resumos
das Palestras do 1º semestre de 2009
Palestrante:
Ralph Silva
Título:
A copula based
approach to adaptive sampling
Resumo
Our article is concerned with adaptive
sampling schemes for Bayesian inference that update the proposal
densities using previous iterates. We introduce a copula based proposal
density which is made more efficient by combining it with antithetic
variable sampling. We compare the copula based proposal to an adaptive
proposal density based on a multivariate mixture of normals and an
adaptive random walk Metropolis proposal. We also introduce a
refinement of the random walk proposal which performs better for
multimodal target distributions. We compare the sampling schemes using
challenging but realistic models and priors applied to real data
examples. The results show that for the examples studied, the adaptive
independent Metropolis-Hastings proposals are much more efficient than
the adaptive random walk proposals and that in general the copula based
proposal has the best acceptance rates and lowest inefficiencies.
This is joint work with Robert Kohn, Paolo Giordani and Xiuyan Mun.
Palestrante:
Claudio Landim
Título:
Medida
estacionárias fora do equilíbrio
Resumo
Propomos uma teoria
termodinâmica para estados estacionários fora do
equilíbrio examinando sistemas de partículas em
contato com reservatórios.
Palestrante:
Alan Gelfand
Título:
Fusing point and
areal level space-time data with application to wet deposition
Resumo
Motivated by the problem of predicting
annual wet chemical deposition in the eastern United States, this paper
develops a framework for joint modeling of point and grid referenced
spatio-temporal data in this context. The proposed hierarchical model
is able to provide accurate spatial interpolation and temporal
aggregation by combining information from observed point referenced
monitoring data and gridded output from a numerical simulation model
known as the Community Multi-scale Air Quality (CMAQ) model. The
technique avoids the change of support problem which arises in other
hierarchical models for data fusion settings to combine point and grid
referenced data. The hierarchical space-time model is fitted to weekly
wet sulfate and nitrate deposition data over the eastern United States.
The model is validated with set-aside data from a number of monitoring
sites. Predictive Bayesian methods are developed and illustrated for
inference on aggregated summaries such as quarterly and annual
deposition maps.
This is joint work with Sujit K. SAHU and David M. HOLLAND.
Palestrante:
Luigi Ippoliti
Título:
Supervised
classification of functional infrared imaging data for differential
diagnosis of Raynaud´s phenomenon
Resumo
This work proposes a supervised
classification approach for the differential diagnosis of
Raynaud’s phenomenon on the basis of functional infrared
imaging data. The classification of data from healthy subjects and from
patients suffering for primary and secondary Raynaud’s
Phenomenon was first attempted by means of linear discriminant analysis
(LDA). Since direct application of LDA on raw data does not lead to
satisfactory results, we shall show that a substantial improvement of
the classification can be achieved by addressing the problem of feature
extraction by means of functional variables and shape measures. The
results of the proposed methodology are shown and discussed for a data
set of 29 subjects.
This is joint work with Simone Di Zio.
Palestrante:
Marcelo Viana
Título:
Sistemas
determinísticos - uma perspectiva estocástica
Resumo
A evolução de
grande parte dos fenômenos naturais é descrita por
modelos matemáticos determinísticos, tais como
equações diferenciais,
iteração de transformações
ou equaçoes diferenciais parciais de
evolução.
No entanto, diversos avanços realizados no século
XX levaram à descoberta de que a compreensão e
previsão do comportamento assintótico de tais
fenômenos frequentemente exige uma abordagem de natureza
estocástica.
Faremos uma apresentação auto-contida das
principais idéias que constituem esta teoria e de alguns
resultados recentes.
Palestrante:
Paulo M. C. Oliveira
Título:
Evolução
das linguagens faladas
Resumo
As línguas faladas pelo
homem evoluem, uma dando origem a outras novas. Linguistas
são capazes de medir a distância entre duas
línguas atuais. Quanto maior for tal distância,
mais remota no tempo estará a língua passada
ancestral comum às duas atuais. Assim, as idades das
línguas atuais e ancestrais podem ser inferidas, e
famílias de línguas são definidas,
apenas com o conhecimento das línguas atuais. É
um trabalho de reconstrução histórica
do passado, da frente para trás, como fazem os geneticistas
e biólogos.
Construimos um modelo computacional de árvore muito simples,
em que cada língua sofre constantemente
mutações e às vezes se bifurca em
duas. Num determinado instante da evolução dessa
árvore, podemos medir distâncias entre pares de
línguas, e daí inferir idades e definir
famílias, da frente para trás como os linguistas.
Na simulação, porém, podemos fazer o
que os linguistas não podem: seguir toda a
história das bifurcações, de
trás para frente, e comparar o resultado real com o
inferido.
Os dados reais disponíveis são o
número de falantes de cada língua atual, e as
línguas pertencentes a cada família. Com tais
dados, construimos a distribuição de
línguas de acordo com o tamanho das
populações falantes, bem como a
distribuição de famílias de acordo com
seu tamanho (número de línguas pertencentes
à mesma família). Os resultados de nossas
simulações reproduzem perfeitamente a realidade.
Um resultado interessante é que a taxa de
mutação é a mesma para todas as
línguas, independente das populações
de falantes, indicando ser essa evolução uma
característica do ser humano e não da sociedade.
Palestrante:
Lelys Guenni
Título:
Detection of
oceanic influence on the precipitation of the central Venezuelan coast
using time-varying models
Resumo
Exceptional rainfall events occurred
during mid-December 1999 produced floods and landslides along the north
central coast of Venezuela with over 10,000 fatalities reported and
economic looses estimated at over 1.8 million (Lyon, 2003). Similar
events occurred also in February, 1951 and February 2005. Wieczorek et
al. (2001) also reported that many of these severe events documented in
the region have occurred during the period November-February. Common
features of the combined anomalies in the Equatorial Pacific and the
North Tropical Atlantic sea surface temperature (SST) were found for
most of the extreme rainfall events. The aim of the analysis is to
detect potential changes in mean daily precipitation and monthly daily
maxima during the November-February months. Dependencies of extremes
and mean daily values on the oceanic features are analyzed using time
varying models. To explore changes in mean daily rainfall dependence on
the SST anomalies, a normal distribution for the cubic root of mean
daily rainfall with a temporal component defined through a Dynamic
Linear model (DLM) or state space representation was used. On another
hand, a non-stationary Generalized Extreme Value (GEV) model with a
time-varying dependence of the location parameter on the oceanic
anomalies, was used to evaluate monthly daily maxima changes with time.
A more clear signal of change is observed for the extreme values than
for the mean values, which agrees with the potential rainfall changes
projected under climate change.
This is joint work with Gabriel Huerta (University of New Mexico) and
Bruno Sansó (University of California at Santa Cruz)
Palestrante:
Claudia Klueppelberg
Título:
Estimating high
quantiles for electricity prices by stable linear models
Resumo
We estimate conditional and
unconditional high quantiles for daily electricity spot prices based on
a linear model with stable innovations. This approach captures the
impressive peaks in such data and, as a four-parametric
family captures also the assymmetry in the innovations. Moreover, it
allows for explicit formulas of quantiles, which can then be calculated
recursively from day to day. We also prove that conditional quantiles
of step $h\in\bbn$ converge for $h\to\infty$ to the corresponding
unconditional quantiles. The paper is motivated by the daily spot
prices from the Singapore New Electricity Market, which serves an
example to show our method at work.
This is joint work with Christine Bernhardt and Thilo Meyer-Brandis.
Palestrante:
Paulo S. Lucio
Título:
Uma alternativa
computacional-Bayesiana para a recuperação de
informação demográfica via algoritmo
“EM”
Resumo
Um dos grandes problemas enfrentados por Sistemas de
Informação de Saúde é a
ocorrência de subnotificações de
nascimentos e óbitos (e doenças), que ainda hoje
em algumas regiões do país, como a Norte e a
Nordeste, são preocupantes. Outro fator limitativo
é a existência de um número
razoável de nascimentos que somente são
registrados em anos posteriores (registro atrasado de
nascimento). Estes problemas trazem como
conseqüência,
imprecisões nas estimativas, diminuindo/ou aumentando,
sobremaneira, as taxas de mortalidade (ou incidência de
doenças), não porque a área tenha
realmente menor/ou maior risco, e sim pelo fato dos óbitos
e/ou nascimentos
(ou doenças) não serem registrados na sua
totalidade. Acrescida a esta problemática, depara-se, em
vários municípios brasileiros, com elevado
número de óbitos por causas desconhecidas ou
mal-definidas, as quais passam a ocupar lugar de destaque dentre as
principais causas de morte, não refletindo a realidade dos
padrões de mortalidade desses municípios. Assim,
este seminário tem como objetivo apresentar uma alternativa
para inferir sobre os números de casos (nascimentos,
óbitos ou doenças) em uma determinada
população, a partir de uma amostra com dados
incompletos. Nesse intuito, e com este propósito,
será apresentado de forma suscinta o algoritmo EM,
("Expectation Maximization") bastante citado na literatura bayesiana
contemporânea. Uma forma particular deste algoritmo
é obtida quando a distribuição de
referência pode ser expressa como casos especiais pertencente
à família exponencial generalizada.
Após simular a população,
será coletada uma amostra, no qual será obtida
uma estimativa do verdadeiro número de casos ou
ocorrências, em seguida, será empregado um
método de reamostragem Bootstrap, com a finalidade de medir
a variabilidade e o erro Monte Carlo e, a partir deste, criar
intervalos de credibilidade para o parâmetro de interesse,
implementando todas as simulações com o software
estatístico R.
Palestrante:
Anthony Davison
Título: Geostatistics
of extremes
Resumo
Climatic change is forecast to change
the frequency and sizes of extreme events such as major storms,
heatwaves and the like, and the effects on human mortality, health and
infrastructure are starting to become of major concern to public health
authorities, engineers, and other planners. Predicting the possible
impacts of such events necessarily entails extrapolation outside the
range of the available data, and the usual basis for this is the
statistics of extremes and its underlying probability models. Analysis
of extreme events for single series of data is now well-established and
used in a variety of disciplines, from hydrology through metallurgy to
finance and insurance, but the corresponding theory for events in space
is underdeveloped. After some motivating material, this talk
will describe the basic probabilistic theory of extremes, and then will
outline how it may be extended to the spatial context, before turning
to more statistical matters such as fitting of appropriate models to
data and their use for prediction of future events.
Palestrante: Peter
J. Green
Título: Bayesian
model-based clustering procedures and application to gene expression
profiles
Resumo
We present a general framework for
Bayesian model-based clustering, in which subset labels are
exchangeable, and items are also exchangeable, possibly up to covariate
effects. It is rich enough to encompass a variety of existing
procedures, including some recently discussed methodologies involving
stochastic search or hierarchical clustering, but more importantly
allows the formulation of clustering procedures that are optimal with
respect to a specified loss function. Our focus is on loss functions
based on pairwise coincidences, that is, whether pairs of items are
clustered into the same subset or not.
We go on to discuss a Bayesian mixture model that allows us to express
a gene expression profile across different experimental conditions as a
linear combination of covariates characterising those conditions, plus
error. In a standard Bayesian nonparametric formulation, the regression
coefficients of the linear combination and the error precisions would
jointly follow a Dirichlet process (DP). In this set-up the clusters
generated by the process are a priori exchangeable. However in the gene
expression context, it commonly occurs that some genes are not
influenced by the covariates, but fall into a `background' class. This
calls for an extension to the DP model generating a background cluster
that is not exchangeable with the others.
This is joint work with Dr John Lau, now at University of Western
Australia.
2º
semestre de 2008
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 10/12 Encerramento do Ciclo
de Palestras de 2008 (excepcionalmente às 14:00 horas)
- Leonardo S. Bastos (Sheffield)
Título: Validating Gaussian process emulators (Resumo)
- Thais C. O. Fonseca (Warwick)
Título: Bastos (Sheffield)
Título: Nongaussian spatiotemporal modeling (Resumo)
- 17/11 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente no CBPF, Auditório do 6o andar
às 14:30 horas)
- Nestor Caticha (IF/USP)
Título: Inferencia,
probabilidade e entropia (Resumo)
- Carla Goldman (IF/USP)
Título: O transporte
mediado por motores moleculares e os processos de exclusao assimetricos
(Resumo)
- 12/11 Silvia Ferrari
(USP)
Título:
Improved likelihood inference in beta regression (Resumo)
- 22/10 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente às 13:30 horas)
- Francisco Cribari (UFPE)
Título: Nearly
unbiased inference under heteroskedasticity of unknown form
(Resumo)
- Marcia D. Branco (USP)
Título:
Inferência Bayesiana em modelos assimétricos
(Resumo)
- 08/10 Cibele Queiroz
da Silva (UnB)
Título:
Bayesian capture-recapture analysis: an application in modeling
semelparity of a neotropical didelphid marsupial (Resumo)
- 23/09 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente no LNCC, Auditório A
às 13:30 horas)
- Elder M. Hemerly (ITA)
Título: Filtro de Kalman: Introdução e
Aplicações em Sistemas de
Navegação (Resumo)
- Marcelo G. S. Bruno (ITA)
Título: Filtros de Partículas e suas
Aplicações em Processamento de Sinais (Resumo)
- 17/09 Apresentações
Prévias de Mestrado*
13:30 Palestrante: Patricia Lusie Coelho Velozo
Título: Modelos para Dados Categóricos com
Estrutura Temporal
14:00 Palestrante: Josiane da Silva Cordeiro
Título: Estimação de
Parâmetros que definem Modelos Determinísticos
14:30 Palestrante: Mariana Albi de Oliveira Souza
Título: Algoritmos para
Maximização da Utilidade Esperada
15:30 Palestrante: Nícia Custódio Hansen
Título: Modelos com Coeficientes Dinâmicos
Variando no Espaço: Uma Aplicação para
Dados de Contagem
16:00 Palestrante: Vera Lúcia Filgueira dos Santos
Título: Teoria de Resposta ao Item: uma abordagem
generalizada das Curvas Características dos Itens
16:30 Palestrante: Denise Reis Costa
Título: Metodologia estatística para
construção de testes adaptativos informatizados
* - Cada apresentação terá
duração de 20 minutos seguida de 10 minutos de
arguição. Elas ficarão divididas em 2
blocos com intervalo de 15:00 às 15:30 hs entre eles.
- 03/09 Marcel T.
Vieira (UFJF)
Título:
Covariance Structure Models for Longitudinal Complex Survey Data (Resumo)
- 20/08 Flavio B.
Gonçalves (Warwick)
Título:
Simulação exata e inferência em
processos de difusão (Resumo)
- 13/08 Marco A. R.
Ferreira (Missouri/UFRJ)
Título:
Gaussian multiscale spatio-temporal models (Resumo)
- 06/08 Hedibert F.
Lopes (Chicago)*
Título:
Particle learning and smoothing (Resumo)
* - o Prof. Hedibert ministrará um tutorial
introdutório sobre Monte Carlo sequencial de 13 as 15 horas.
Resumos
das Palestras do 2º semestre de 2008
Palestrante:
Leonardo S. Bastos
Título:
Validating Gaussian process emulators
Resumo
In this talk, I am going to give a brief introduction of complex
Computer models, also known as simulators, that are widely used in all
areas of science and technology to represent complex real-world
phenomena. Simulators are often sufficiently complex that they take
appreciable amounts of computer time or other resources to run. In this
context, a methodology has been developed based on building a
statistical representation of the simulator, known as an emulator. The
principal approach to building emulators uses Gaussian processes. I am
going to present a set of diagnostics to validate and assess the
adequacy of a Gaussian process emulator as surrogate for the simulator.
These diagnostics are based on comparisons between simulator outputs
and Gaussian process emulator outputs for some test data, known as
validation data, defined by a sample of simulator runs not used to
build the emulator. Our diagnostics take care to account for
correlation between the validation data.
Palestrante:
Thais C. O. Fonseca
Título:
Nongaussian spatiotemporal modeling
Resumo
In this work, we develop and study nongaussian models for processes
that vary continuously in space and time. The main goal is to consider
heavy tailed processes that can accommodate both aberrant observations
and clustered regions with larger observational variability. These
situations are quite common in meteorological applications where
outliers are associated with severe weather events such as tornados and
hurricanes. In this context, the idea of scale mixing a gaussian
process as proposed in Palacios and Steel (JASA, 2006) is extended and
the properties of the resulting process are discussed. The model is
very flexible and it is able to capture variability across time that
differs according to spatial locations and variability across space
that differs in time. This is illustrated by an application to maximum
temperature data in the Spanish Basque Country. The model allows for
prediction in space-time since we can easily predict the mixing process
and conditional on the latter the finite dimensional distributions are
gaussian. The predictive ability is measured through proper scoring
rules such as log predictive scores and interval scores. In addition,
we explore the performance of the proposed model under departures from
gaussianity in a simulated study where data sets were contaminated by
outliers in several ways; overall, the nongaussian models recover the
covariance structure well whereas the covariance structure estimated by
the gaussian model is very influenced by the contamination.
Palestrante:
Nelson Caticha
Título:
Inferencia, probabilidade e entropia
Resumo
Este
colóquio trata de inferência indutiva, ou seja, o
problema de lidar de forma racional com casos em que há
informação incompleta. Como quantificar que uma
asserção é mais plausível
que outra?Como evitar algumas inconsistências de
raciocínio?A tentativa de extensão da
lógica Aristotélica para
situações em que não há
informação completa levou Cox nos anos 40a se
perguntar qual seria a estrutura matemática adequada para
lidar de forma racional com estes casos. Não é
uma surpresa que a estrutura matemática adequada seja a
teoria de probabilidades. A surpresa está em que isso possa
ser deduzido. Inferência se reduz agora ao problema de
atribuir probabilidades com base na informação e
às mudanças decorrentes da
aquisição de nova
informação. Existe uma forma geral de realizar
inferência que satisfaça certos requisitos
básicos? A imposição do resultado em
alguns casos simples leva ao método geral de
máxima entropia. Inferência pode ser interpretada
de um ponto de vista geométrico. Após a
apresentação simplificada dos resultados acima
serão mostradas algumas aplicações a
problemas de aprendizado e análise de dados.
Palestrante:
Carla Goldman
Título:
O transporte mediado por motores moleculares e os processos de exclusao
assimetricos
Resumo
Motores
moleculares, em particular as kinesinas e dineínas,
são proteínas capazes de realizar transporte
ativo de objetos como organelas, vesículas,
vírus, etc em ambiente celular, ao longo de
micro-túbulos ou filamentos, onde as forças
viscosas têm papel predominante e, portanto, determinam o
caráter estocástico do processo nas escalas
microscópicas. O “modelo
padrão” proposto no início dos anos 90
por Adjari, Astumian, Prost e Magnhasco, prevê propriedades
do movimento executado por estas proteínas nestas escalas,
que vão de encontro aos dados experimentais da
época, obtidos a partir da observação
de um único motor. Surpreendentemente, experimentos mais
recentes, obtidos de sistemas in vivo, indicam que o movimento das
partículas transportadas, referidas como
“carga” - não acompanha,
necessariamente, o movimento previsto e observado dos motores, quando
analisados individualmente. Em particular, observa-se que a
“carga” muda de sentido diversas vezes antes de
atingir seu destino final, em um movimento não-difusivo,
denominado bidirecional, que pode ser caracterizado na melhor das
hipóteses, por grandes flutuações de
sentido. Desde então, diversas possibilidades tem sido
apontadas para as causas deste movimento bidirecional. Há
consenso, no entanto, em torno da idéia de que seja devido a
um efeito coletivo dos motores. O que ainda necessita resposta
é a natureza deste tipo de efeito e como
identificá-lo por meio a uma descrição
mais analítica destes sistemas. Neste colóquio,
faremos uma breve revisão do “modelo
padrão” e das discussões existentes na
literatura a respeito da caracterização de tal
efeito coletivo. Em seguida, mostraremos como é
possível a descrição de propriedades
destes sistemas, vistos como sistemas de partículas, por
meio de um da análise de um modelo que descreve um processo
de exclusão assimétrico (ASEP). Este modelo foi
proposto por nós recentemente para incluir as
partículas motoras em interação com
partículas “escravas”, identificadas
como a “carga”. O modelo apresenta uma
transição de fase do tipo
condensação que, como mostraremos, pode ser
explorada como alternativa para a compreensão do movimento
bidirecional mencionado.
Palestrante:
Silvia Ferrari
Título:
Improved likelihood inference in beta regression
Resumo
We consider the
issue of performing accurate small-sample likelihood-based inference in
beta regression models, which are useful for modeling continuous
proportions that are affected by independent variables. We derive
Skovgaard's (Scandinavian Journal of Statistics, 28 (2001) 3-32)
adjusted likelihood ratio statistic in this class of models. We show
that the adjustment term has a simple compact form that can be easily
implemented from standard statistical software. We present Monte Carlo
simulations showing that inference based on the adjusted statistic we
propose is more reliable than that based on the usual likelihood ratio
statistic.
Palestrante:
Marcia D. Branco
Título:
Inferência Bayesiana em modelos assimétricos
Resumo
Nos
últimos anos novas classes de
distribuições de probabilidade multivariadas e
não simétricas tem sido propostas na literatura.
O principal interesse é fornecer uma alternativa
à suposição de normalidade usualmente
considerada na modelagem estatística. Essa alternativa deve
acomodar diferentes assimetrias, curtoses e eventualmente
multimodalidade. Além disso, essas
distribuições de probabilidade devem possibilitar
algum tipo de tratamento analítico de modo a facilitar a
inferência estatística. As
distribuições assimétricas induzidas
por processos de seleção, discutidas
em Arellano, Branco e Genton (2006) têm as
características descritas anteriormente. Nesta
apresentação discutiremos algumas dessas
distribuições de probabilidades, tais como,
normal-assimétrica e t-assimétrica.
Aplicações envolvendo modelos lineares mistos e
modelos binários serão apresentadas. A abordagem
de inferência considerada para todas as
aplicações será a bayesiana, com
destaque para o uso de distribuições a priori
objetivas.
Palestrante:
Francisco Cribari
Título:
Nearly unbiased inference under heteroskedasticity of unknown form
Resumo
The linear
regression model is commonly used by practitioners to model the
relationship between the variable of interest and a set of explanatory
variables. The assumption that all error variances are the same, known
as homoskedasticity, is oftentimes violated when cross sectional data
are used. Consistent standard errors for the ordinary least squares
estimators of the regression parameters can be computed following the
approach proposed by White (1980). Such standard errors, however, are
considerably biased in samples of typical sizes. An improved covariance
matrix estimator was proposed by Qian and Wang (2001). We improve upon
the Qian-Wang estimator by defining a sequence of bias adjusted
estimators with increasing accuracy. The numerical results reveal that
the Qian-Wang estimator is typically much less biased than the
estimator proposed by Halbert White and that our correction to the
former can be quite effective in small samples. Finally, we show that
the Qian-Wang estimator can be generalized into a broad class of
heteroskedasticity-consistent covariance matrix estimators, and our
results can be easily extended to such a class of estimators.
Palestrante:
Cibele Q. Silva
Título:
Bayesian capture-recapture analysis: an application in modeling
semelparity of a neotropical didelphid marsupial
Resumo
We develop a
series of Bayesian statistical models for estimating survival of a
neotropic didelphid marsupial, the Brazilian gracile mouse opossum
(Gracilinanus microtarsus). These models are based on the
Cormack-Jolly-Seber model (Cormack, 1964; Jolly, 1965; Seber, 1965)
with both survival and recapture rates expressed as a function of
covariates using a logit link. The proposed models allow taking into
account heterogeneity in capture probability caused by the existence of
different groups of individuals in the population. The models were
applied to two cohorts (Cohort 2000 and Cohort 2001) with the first one
including 14 and the second one 15 sampling occasions. The best models
for each of the cohorts indicate that it G. microtarsus is best
described as partially semelparous, a condition in which mortality
after the first mating is high but graded over time, with a fraction of
males surviving for a second breeding season (Boonstra, 2005).
Palestrante:
Marcelo G. S. Bruno
Título:
Filtros de Partículas e suas
Aplicações em Processamento de Sinais
Resumo
Métodos Monte Carlo sequenciais também conhecidos
como filtros de partículas têm recebido crescente
atenção recentemente como um método
alternativo para aproximar a solução de
mínimo erro quadrático médio do
problema de inferência recursiva de estados ocultos em
sistemas dinâmicos não-lineares e
não-gaussianos. Ao contrário de
métodos paramétricos como o filtro estendido de
Kalman (EKF), os algoritmos de filtragem de partículas
não buscam representar a distribuição
a posteriori das variáveis ocultas por expressões
analíticas fechadas. Ao invés disso, busca-se
construir a cada instante um conjunto apropriadamente ponderado de
amostras aleatórias (ou "partículas") tal que,
à medida que o número de amostras cresce, sua
média ponderada aproxima a esperança das
variáveis de estado condicionada às
observações. Esse conjunto apropriado de amostras
e os seus respectivos pesos são atualizados recursivamente
usando o modelo em espaço de estados subjacente ao problema
de inferência que se deseja resolver. Neste
seminário, apresenta-se o conceito de amostragem por
importância sequencial no qual se baseiam os filtros de
partículas e discutem-se técnicas usuais de
otimização de filtros de partículas
encontradas na literatura. A seguir, examina-se o problema de
estimação por filtros de partículas de
variáveis de estado ocultas em sistemas dinâmicos
com parâmetros aleatórios desconhecidos. O
problema em discussão é ilustrado no contexto de
aplicações específicas desenvolvidas
pelo ITA nas áreas de equalização cega
de canais de comunicação seletivos em
frequência e rastreamento de alvos balísticos no
estágio de reentrada da atmosfera. Finalmente, discute-se
brevemente como, a partir da teoria de grafos
probabilísticos, podem ser deduzidas versões
distribuídas dos algoritmos propostos, adequadas para
operação em redes de sensores/receptores.
Palestrante:
Elder M. Hemerly
Título:
Introdução e Aplicações em
Sistemas de Navegação
Resumo
Sistemas de
navegação baseados em
integração de múltiplos sensores
(inercial, GPS, odômetro, dentre outros) objetivam explorar
as boas características de cada sensor. Um caso
típico se refere à fusão IMU/GPS: o
primeiro assegura elevadas taxas de amostragem e é imune a
interferências, enquanto o segundo proporciona leituras de
posição sem derivas. Embora diversas abordagens
possam ser utilizadas para se realizar a
integração, o uso do Filtro de Kalman
é particularmente eficiente, pois sistematiza o projeto
decompondo-o em duas fases: a) modelagem dos erros e b)
sintonização dos parâmetros de projeto.
Os principais aspectos teóricos e práticos
envolvidos no desenvolvimento de sistemas de
navegação usando múltiplos sensores,
via Filtro de Kalman, serão abordados nesta palestra.
Exemplos típicos de aplicação
serão apresentados e discutidos.
Palestrante:
Marcel T. Vieira
Título:
Covariance Structure Models for Longitudinal Complex Survey Data
Resumo
Complex designs
are often used to select the sample which is followed over time in a
panel survey. We consider some parametric models for panel data and
discuss methods of estimating the model parameters which allow for
complex schemes. We incorporate survey weights into alternative point
estimation procedures. These procedures include pseudo maximum
likelihood (PML) and various forms of generalized least squares (GLS).
We also consider variance estimation using linearization methods to
allow for complex sampling. The behaviour of the proposed inference
procedures are assessed in a simulation study, based upon data from the
British Household Panel Survey. The point estimators have broadly
similar performance, with few significant gains from GLS estimation
over PML estimation. The need to allow for clustering in variance
estimation methods is demonstrated. Linearization variance estimation
performs better, in terms of bias, for the PML estimator compared to a
GLS estimator. Some extensions to model fitting statistics when working
with longitudinal data in a complex survey design framework are also
considered.
Palestrante:
Flavio B. Gonçalves
Título:
Simulação exata e inferência em
processos de difusão
Resumo
Nesta palestra,
vou
apresentar o Exact Algorithm proposto em Beskos, Papaspiliopoulos and
Roberts (2006) para simulação exata de uma classe
de processos de difusão. O algoritmo é exato no
sentido de não apresentar erro de
discretização. Posteriormente, vou apresentar um
método baseado no Exact Algorithm para fazer
inferência em processos de difusão (Beskos et al.,
2006). No final, menciono um pouco do meu trabalho em processos de
difusão com saltos.
Referências:
Beskos, A; Papaspiliopoulos, O. e Roberts, G. O. (2006). Retrospective
exact simulation of diffusion sample paths with applications.
Bernoulli, 12 (6), 1077-1098.
Beskos, A., Papaspiliopoulos, O., Roberts, G. O., e Fearnhead, P.
(2006), Exact and computationally efficient likelihood-based inference
for discretely observed diffusion processes (with discussion), J. R.
Stat. Soc. B 68(3), 33-382.
Palestrante:
Marco A. R. Ferreira
Título:
Gaussian multiscale spatio-temporal models
Resumo
We develop a new
class of multiscale spatio-temporal models for Gaussian areal data. Our
framework decomposes the spatio-temporal observations and underlying
process into several scales of resolution. Under this
decomposition the model evolves the multiscale coefficients through
time with structural state-space equations. The multiscale
decomposition considered here, which includes wavelet decompositions as
particular case, is able to accommodate irregular grids and
heteroscedastic errors. The multiscale spatio-temporal framework we
develop has several salient attributes. First, the multiscale
decomposition leads to an extremely efficient divide-and-conquer
estimation algorithm. Second, the multiscale coefficients have an
interpretation of their own; thus, the multiscale spatio-temporal
framework may offer new insight on understudied multiscale aspects of
spatio-temporal observations. Finally, deterministic relationships
between different resolution levels are automatically respected for
both the observations, the latent process, and the estimated latent
process. We illustrate the use of our multiscale framework with an
analysis of a spatio-temporal dataset on agriculture production in the
state of Espirito Santo, Brazil.
Joint work with Adelmo Bertolde and Scott Holan.
Palestrante:
Hedibert Lopes
Título: Particle learning and
smoothing
Resumo
This paper provides
novel particle learning (PL) methods for sequential parameter learning
and smoothing in state space models with non-normal errors, non-linear
observation equations, and non-linear state evolutions. The methods
extend existing particle methods by incorporating unknown parameters,
utilizing sufficient statistics, for the parameters and/or the states,
and allowing for nonlinearities in the state and/or observation
equation. We also show how to solve the state smoothing problem,
integrating out parameter uncertainty. Previously, the only approach
available for this marginal smoothing problem is MCMC. We show that our
algorithms outperform MCMC, as well existing particle filtering
algorithms such as the mixture Kalman filter.
Joint work with Carlos M. Carvalho, Michael Johannes and Nicholas
Polson.
1º semestre de 2008
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 25/07 (excepcionalmente
6ª feira) Danny Pfeffermann (Jerusalem/Southampton)
Título:
Small area estimation, the state of the art (Resumo)
- 25/06 Pedro Dias
(LNCC/USP)
Título:
Mudanças climáticas: como conviver com as
incertezas? (Resumo)
- 07/05 Marcel T.
Vieira (UFJF)
Título:
(adiado para o dia 03/09)
- 30/04 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente no IMPA, Auditório Ricardo
Mañé às 13:30 horas)
- Pierre Nolin (ENS-Paris)
Título: Near-critical percolation and the geometry of
diffusion fronts (Resumo)
- Wendelin Werner, Medalha Fields 2006
(ENS-Paris)
Título: Are random frontiers always symmetric? (Resumo)
- 09/04 Vitor Ozaki
(ESALQ-USP)
Título:
Modelos de fronteira estocástica de custo com forma
funcional flexível Fourier: uma abordagem Bayesiana (Resumo)
- 28/03 (excepcionalmente às 13:30h)
Trevor Bailey (Exeter)
Título:
Spatial survival modelling in animal disease epidemics (Resumo)
- 12/03 (excepcionalmente às 15:00h)
Pasquale Valentini (Pescara)
Título:
Reduced rank regression and its applications in spatial and stochastic
frontier analysis (Resumo)
- 05/03 Reunião
entre Alunos e Corpo Docente
Resumos das Palestras do
1º semestre de 2008
Palestrante:
Danny Pfeffermann
Título: Small area estimation, the
state of the art
Resumo
In
this presentation I shall review the methods proposed in the literature
for small area estimation. The following approaches and methods will be
covered:
1. Design-based methods, advantages and limitations 2. Frequentist
model based methods
3. Bayesian model-based methods 4. Methods using time
series/cross-sectional models
5. Recent advances: Accounting for measurement errors and outliers,
choice of priors, ranking, M-quantiles,…
Palestrante:
Pedro Dias
Título:
Mudanças climáticas: como conviver com as
incertezas?
Resumo
O Painel
Intergovernamental de Mudanças Climáticas
(IPCC) aponta, claramente, para cenários
climáticos para os próximos 100 anos nos quais o
efeito antrópico é evidente. Os
cenários do IPCC são mais sólidos no
que se refere às características
médias do clima terrestre. Por exemplo, a
temperatura media da terra deve aumentar assim como as chuvas.
Entretanto, ninguém vive no chamado “clima
médio terrestre” e existe incerteza significativa
quanto aos efeitos regionais apesar de ter havido grande no
último relatório quanto aos aspectos
climáticos regionais. O IPCC também
aponta para extremos climáticos mais freqüentes
(secas , enchentes, ondas de calor e mesmo de frio). Portanto,
é evidente que é preciso estabelecer
políticas públicas que nos preparem para
situações climáticas adversas.
Em primeiro lugar, devemos aprender a conviver com a
variabilidade climática natural. É
preciso reconhecer que já tivemos
flutuações climáticas de causas
estritamente naturais de grande porte. Por ex., a década de
40-60 foi cerca de 15% mais seca no SE brasileiro que o
período 70-90. Houve evidente impacto na
utilização de recursos hídricos para a
geração de energia elétrica e na
agricultura. Esses eventos do passado recente precisam ser melhor
estudados, do ponto de vista dos impactos sociais e
econômicos. Outro aspecto fundamental que as
políticas públicas devem abordar: quanto investir
na redução das emissões e na
adaptação? O custo da
descarbonização da nossa economia precisa ser
melhor avaliado. O custo da adaptação
também necessita melhor quantificação.
A decisão quanto ao caminho futuro
depende de uma análise critica desses custos e das
incertezas nos cenários futuros.
Palestrante:
Wendelin Werner
Título:
Are random frontiers always symmetric?
Resumo
We will make comments on the following problem:
Suppose that a two- dimensional domain is created at random from many
infinitesimal local inputs, and that one only observes its outer
boundary. Can one detect on which side the domain is by looking at a
portion of this boundary? The talk is partly based on joint work with
Pierre Nolin.
Palestrante:
Pierre Nolin
Título:
Near-critical percolation and the geometry of diffusion fronts
Resumo
We discuss a model of inhomogeneous medium
known as "Gradient Percolation", which is an inhomogeneous percolation
process where the den- sity of occupied sites depends on the location
in space. This model was ¯rst introduced by the physicists
Gouyet, Rosso and Sapoval in 1985 to show nu- merical evidence that
diffusion fronts are fractal. The macroscopic interface - separating
occupied sites and vacant sites - that appears remains localized in
regions where the density of occupied sites is close to the percolation
threshold pc, and its behavior can be described using properties of
near-critical standard percolation. This allows to study a simple
two-dimensional model where a large number of particles that start at a
given site diffuse independently. As the particles evolve, a
concentration gradient appears and we observe a macroscopic interface.
We exhibit in particular a regime where this (properly rescaled)
interface is fractal with dimension 7/4: this model thus provides a
natural setting where fractal geometry
spontaneously arises, as predicted by physicists.
Palestrante:
Vitor Ozaki
Título:
Modelos de fronteira estocástica de custo com forma
funcional flexível Fourier: uma abordagem Bayesiana
Resumo
O
processo de quantificar eficiência de firmas consiste em
comparar firmas dentro da mesma tecnologia de
produção, valorizando as que utilizam melhor seus
insumos e produtos, minimizam seus custos ou maximizam seus lucros.
Existe uma variedade de formas funcionais utilizadas em modelos de
fronteira estocástica, as mais conhecidas são a
Cobb-Douglas, translog e Leontief generalizada e algumas vezes
é difícil julgar qual delas deve ser escolhida,
desde que a forma verdadeira é desconhecida e pode ser
somente aproximada. O objetivo deste trabalho é calcular a
eficiência econômica de cada firma envolvida no
processo de produção utilizando os modelos de
fronteira estocástica de custo com forma funcional
flexível Fourier, que aproximam a fronteira da
função de custo verdadeira tanto quanto os dados
permitirem, através da abordagem Bayesiana. Apresenta-se um
estudo de simulação e analisa-se dados reais que
referem-se a 382 hospitais nos Estados Unidos, observados nos anos de
1987 a 1991.
Palestrante:
Trevor Bayley
Título:
Spatial survival modelling in animal disease epidemics
Resumo
The
potentially large economic impacts of animal disease epidemics have
been highlighted in recent years through outbreaks
such as foot-and-mouth disease (FMD) in the UK during 2001. This talk
reports work from a project with the Veterinary Laboratories
Agency (VLA), Weybridge, UK which was concerned with use of survival
modelling to develop dynamic space-time predictions of
survivor and hazard functions for individual farm premises as an FMD
epidemic progresses. Such survival analyses could
provide powerful insights into the patterns of infection, and assist in
optimising various aspects of the operational response
activities, such as targeting of `at-risk' premises. The talk will
discuss and compare various possible model formulations using both
simulated and real data based on the 2001 UK FMD epidemic and then go
on to illustrate how model predictions may be used to refine response
activities.
Palestrante:
Pasquale Valentini
Título:
Reduced rank regression and its applications in spatial and stochastic
frontier analysis
Resumo
The
talk considers the general model of reduced rank regression (RRR). RRR
is useful to model the asymmetric linear relationship between two sets
of predictants and predictors. Sometimes there is a need to reduce the
number of parameters in the multivariate regression model imposing
constraints on the rank, r, of the matrix of coefficients. A special
case of interest is when r=1, which allows for the discussion of a
model with applications in multi-output stochastic frontier analysis
and spatial regression models.
2º
semestre de 2007
As palestras são realizadas
na sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário.
- 10/12
(excepcionalmente 2a feira)
Peter
Guttorp (Washington)
Título:
Modeling extremes for air pollution and climate (Resumo)
- 21 /11 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente no CBPF, Auditório do 6o andar
às 15 horas)
- André Nachbin (IMPA)
Título: Ondas em meios desordenados (Resumo)
- Alejandro C. Frery (UFAL/IMPA)
Título: Redes de sensores sem fio (Resumo)
- 12/11
(excepcionalmente 2a feira)
Carlos
D. Paulino (Lisboa)
Título:
Infecção viral pelo papiloma humano –
uma análise bayesiana de regressão binomial com
resposta mal classificada (Resumo)
- 05/11
(excepcionalmente 2a feira)
Hedibert
F. Lopes (Chicago)
Título:
Sex chromosome evolution and gene expression in Drosophila
spermatogenesis (Resumo)
- 31/10
Corpo Docente da PG - Estatística
Título:
Apresentação das linhas de pesquisa do Programa
de Pós-Graduação em
Estatística do IM-UFRJ
- 17/10 Otto
Côrrea Rotunno (UFRJ)
Título:
Modelagem hidrológica-atmosférica aplicada a
gestão de bacias hidrográficas (Resumo)
- 03/10 Leandro
Pimentel (USP)
Título: Métricas
sobre triangulações aleatórias do
plano (Resumo)
- 19/09 Gerson
Zaverucha (UFRJ)
Título: Avanços
em Revisão de Teorias de Primeira Ordem e em
Previsão de Séries Temporais (Resumo)
- 12/09
Prévias de Mestrado
Palestrante:
Felipe Rafael Ribeiro Melo
Título:
Estimação das taxas de
infecção e cura no Processo de Contato
Palestrante:
Leonardo Correia da Costa
Título:
Modelos de fronteira estocástica com componente espacialPalestrante:
Luiz Ledo Mota Melo Jr
Título:
Modelos espaço-temporais aplicados a óbitos por
causas externas no estado do Paraná
Palestrante: Fabio
Figueiredo Farias
Título:
Previsão de
resultados em partidas de futebol
- 22/08
Flávio F. Nobre (UFRJ)
Título: Métodos
Estatísticos e Computacionais em Análise de Dados
Epidemiológicos e na Genômica Computacional e
Bioinformática (Resumo)
Resumos
das Palestras do 2º semestre de 2007
Palestrante:
Peter Guttorp
Título:
Modeling extremes for air pollution and climate
Resumo
Air
quality regulations are often set based on observations at approved
monitoring stations. However, the intent of the regulation is typically
to protect people in a larger area from dangerous exposure to
pollution. We look at the distribution of the maximum of a transformed
Gaussian process over a finite set to assess the effective protection
of an observation just within the limits of regulation. The technical
tool needed is a generalization of Rice's formula to two dimensions.
Recent work in human-induced climate change attempts to attribute
extreme events to climatic changes, by simulating climate with and
without antrhopogenic forcing. We look at some tools available for
modeling extreme climate events, look at some data analytic approaches,
and discuss possible ways of estimating trends in extreme climate
events.
Palestrante:
André Nachbin
Título: Ondas em meios desordenados
Resumo
O principal foco deste trabalho está
na modelagem física e matemática de ondas em
meios heterogêneos. Muitos problemas nesta área
lidam com meios de propagação tendo propriedades
físicas que oscilam rapidamente e de forma desordenada. Em
muitos destes casos é interessante utilizar modelagem
estocástica. Por exemplo, com equações
diferenciais parciais (EDPs) apresentando coeficientes
aleatórios. Diferentes técnicas podem ser
consideradas: homogeneização, teoria dos campos
médios ou análise assintótica de
equações diferenciais estocásticas.
Para o nosso contexto de ondas interagindo com uma microestrutura,
discutiremos brevemente os diferentes significados físicos
destas diferentes técnicas. E também indicaremos
como apenas a última captura com precisão os
fenômenos de interesse: o da Difusão Aparente,
assim como o da refocalização de pulsos por
Reversão- Temporal. E ainda temos um fato surpreendente: o
fenômeno de refocalização é
mais eficiente em um ambiente aleatório do que no caso
homogêneo! Resultados da modelagem e teoria
matemática serão ilustrados através de
simulações computacionais, em particular, para
ondas acústicas e ondas aquáticas longas como,
por exemplo, tsunamis.
Palestrante:
Alejandro C. Frery
Título: Redes de sensores sem fio
Resumo
As
redes de sensores sem fio (Wireless Sensor Networks) são
conjuntos de dispositivos
que obtêm amostras de fenômenos ambientais, sejam
eles naturais (como, por exemplo,
temperatura, pressão atmosférica, intensidade de
iluminação, concentração de
substâncias em cursos d'água) ou
antrópicos (qualidade do ar em sinais de trânsito,
pressão ao longo de um oleoduto). Cada sensor coleta
informações de forma contínua
ou em instantes de tempo que podem ser regulares ou disparados por
eventos. Essas
informações são repassadas a
nós especiais que, tipicamente, aplicam
operações para
reduzir o volume de dados, e, feito isso, novamente as enviam para um
nó central onde
decisões são tomadas. Essa é uma
vigorosa área de pesquisa multidisciplinar, com
inúmeros problemas que abrangem desde a modelagem dos
processos associados e
estratégias de inferência, até aspectos
tecnológicos aguardando por soluções
satisfatórias. Nesta palestra apresentaremos os principais
conceitos relativos às redes de
sensores sem fio, no intuito de discutir algumas dessas oportunidades
de pesquisa.
Palestrante:
Carlos D. Paulino
Título:
Infecção viral pelo papiloma humano –
uma análise bayesiana de regressão binomial com
resposta mal classificada
Resumo
Motivados
por um estudo da infecção em mulheres pelo
vírus papiloma humano, apresentamos uma análise
bayesiana de regressão Binomial em que a variável
resposta é susceptível de
classificação errada. A nossa abordagem iterativa
conduz a inferências aproximadas (com grau de
aproximação controlável pelo analista)
sobre as probabilidades de classificação errada e
sobre os parâmetros que representam efeitos das
covariáveis nas probabilidades de resposta para
vários modelos lineares generalizados, tornando
possível a selecção de modelos.
Palestrante:
Hedibert F. Lopes
Título: Sex
chromosome evolution and gene expression
in Drosophila spermatogenesis
Resumo
Background:
The Drosophila genome is constituted of a group of genes that are
distributed in diferent
chromosomes: three pairs of autosomes and the sex chromosomes (X and
Y). The study of sex chromosome
evolution main purpose is to understand which genes are localized in
and out of the sex chromosomes. In
addition, evolutionary biologists are interested in understanding the
mechanisms and selective forces driving
such distribution.
In the last decade, one important observation regarding the evolution
of sex chromosomes is the unidirectional
movement of genes out of the X chromosome to the autosomes.
Interestingly, those genes are especially
expressed (active) in the male reproductive tract, the testis. One
explanation for the unidirectional movement
of genes is the possible X inactivation during spermatogenesis
(spermatozoa formation and development). In
other words, if X is inactivated then spermatogenic expressed genes
that move out of the X chromosome to
autosomes are expected to be selected during evolution.
However, the spermatogenic X-inactivation has not yet been proved in
Drosophila. There are only indirect
evidences that strongly suggest that the X chromosome ceases its
expression during spermatogenic meiotic
stage. Moreover, even if the X becomes inactive, the unidirectional
movement of genes out of X chromosome
is not necessarily caused by the decrease of expression level. Results:
Here we investigate meiotic X-inactivation in Drosophila melanogaster
by monitoring X-linked
and autosome gene expression during developmental phases of
spermatogenesis. Cells from two di
erent
phases were collected: spermatogonias, the mitotic cells; and
spermatocytes, the cells in meiotic division.
Genes that are putatively over or under expressed in meiosis were
selected by quantifying and comparing
the mRNA level in the two di
erent phases using Microarray analysis (Genechip arrays from A
ymetrix).
Multiple hypothesis testing and inference were conducted by Bayesian
hierarchical modeling (BHM) in order
to classify 18,000 genes (3,000 X-linked genes and 15,000 autosome
genes) as over, under, equally expressed.
The main motivation for using this modeling structure is to avoid
inconsistencies of standard frequentist
multiple hypothesis testing commonly encountered in the analysis of
gene expression. In agreement to Xinactivation
hypothesis, we observed depletion and enrichment of X-linked genes over
and under expressed
in meiosis, respectively. In other words, the expression of X-linked
genes is under represented in meiosis
compared to autosome genes.
In order to investigate if X-inactivation is one of the selective
forces driving the unidirectional movement
of genes out the X chromosomes, we compared gene expression of a
specific set of genes that moved between
chromosomes during Drosophila genus evolution. We show that, based on
an extension of the previous BHM,
genes moving out of the X-chromosome have a higher posterior
probability of being under-expressed in meiosis
than genes moving out of the autosomes. Conclusion:
By properly accounting for the uncertainties regarding the gene
expression measurements and
interactions, as well as gene biology, our modeling approach explicitly
and probabilistically quantifies X-linked
gene expression, pointing in favor of the X-inactivation hypothesis. In
addition, pioneer evidence of meiotic
X chromosome under-expression as driving force for gene movement out of
the X chromosome is provided.
Palestrante:
Otto Côrrea Rotunno
Título: Modelagem
hidrológica-atmosférica aplicada a
gestão de bacias hidrográficas
Resumo
Com a preocupação cada
vez maior com o meio ambiente, surge a necessidade de se estudarem
modelos que reconheçam e representem adequadamente as
características hidrológicas de uma determinada
região, para que se possam obter resultados
confiáveis quando da simulação dos
efeitos causados pela mudança no uso do solo, desmatamento,
ou mesmo, poluição ou erosão do meio
natural.
Deve-se, no entanto, ressaltar que a modelagem hidrológica
com base
física não deve estar dissociada do contexto de
sua aplicação: a bacia
hidrográfica e o seu respectivo gerenciamento. Nesse
sentido, o presente seminário visa a discussão
sobre a construção
de uma base de dados e o desenvolvimento de ferramentas de
análise integráveis
a um sistema de apoio à decisão voltado
à gestão de recursos hídricos. O
enfoque concentra-se na geração e
consolidação de informação
temática básica,
desenvolvimento e avaliação de metodologias na
escala da bacia hidrográfica com
base na implementação de áreas
especialmente monitoradas.
Palestrante:
Leandro Pimentel
Título: Métricas sobre
triangulações aleatórias do plano
Resumo
Neste seminário iremos estudar o
comportamento assintótico de métricas
aleatórias definidas sobre
triangulações aleatórias do plano.
Focaremos em questões como Leis dos Grandes
Números e Teorema do Limite Central.
Palestrante:
Gerson Zaverucha
Título: Avanços em
Revisão de Teorias de Primeira Ordem e em
Previsão de Séries Temporais
Resumo
A palestra será dividida em duas
partes, conforme indica o título. Na primeira parte,
Revisão de teorias é o processo de melhorar
teorias geradas automaticamente ou definidas pelo usuário,
dado um conjunto de exemplos. A utilização de
sistemas de revisão de teorias de Primeira-ordem tem sido
limitada pelo custo de buscar em um grande espaço de
hipóteses. Esta é uma dificuldade geral no
aprendizado de teorias, mas trabalhos recentes mostram que
técnicas de busca local estocástica (SLS)
são efetivas ao menos quando as teorias são
aprendidas a partir do zero. Serão apresentados uma
introdução aos algoritmos de revisão
de teorias de primeira-ordem tanto lógicas (FOL) quanto
probabilísticas (SRL) e então algoritmos que
aplicam SLS a esses sistemas de revisão de teorias.
Resultados experimentais mostram que: (1) o tempo de
execução é reduzido
significativamente; (2) a acurácia em
relação a teoria inicial obtida
através do sistema de ILP Aleph é sempre
melhorada.
Na segunda parte, será apresentado um sistema de
previsão de séries temporais baseado em ensemble
de filtros de partículas utilizando
estimação não-paramétrica
de densidade com kernels para a representação dos
modelos de transição e
observação, fazendo o aprendizado dos kernels
através de um algoritmo baseado no EM, e selecionando os
componentes do ensemble pela análise das Curvas de Erros de
Regressão (REC).
Palestrante:
Flávio F. Nobre
Título: Métodos
Estatísticos e
Computacionais em Análise de Dados
Epidemiológicos e na Genômica Computacional
e Bioinformática
Resumo
Nessa palestra serão
inicialmente apresentados temas relacionados com séries
temporais e análise
espacial em epidemiologia utilizando técnicas de redes
neurais e teoria de
grafos. A seguir, apresentaremos temas relacionados com a
área de Genômica
Computacional e Bioinformática, recentemente criada no
Laboratório de
Engenharia de Sistemas em Saúde –LESS, enfocando a
utilização de técnicas
estatísticas e computacionais na análise de
experimentos de microarranjos de
cDNA para identificação de genes diferencialmente
expressos e classificação de
tumores, bem como pesquisa relativa a
identificação e monitoração
de
resistência genotípica
(mutações do HIV) em pacientes em uso de terapia
antiretroviral.
1º
semestre de 2007
As palestras são realizadas na sala C-116 do Centro
Tecnológico as 15:30 h, a menos que ocorra aviso em
contrário.
- 04/07 Bruno
Sansó (UCSC - EUA) (Resumo)
Título: Spatially
Varying Temperature Trends in a Central California Estuary
- 29/06 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente 6a feira as 13:30h,
IM-UFRJ C-116)
- Ronald Dickman (UFMG)
Título: Fluidos com interações
repulsivas numa escada meio-dirigida: decaimento lento de
correlações
- Nancy L. Garcia (UNICAMP)
Título: Spatial birth and death processes as solutions of
stochastic equations
- 20/06 Reunião
entre Alunos e Corpo Docente
- 13/06 Fernando
Moala (UNESP - SP) (Resumo)
Título: Elicitação
de distribuições a priori multivariadas : Um procedimento
Bayesiano não-paramétrico
- 23/05 Sergio
Firpo (PUC - RJ) (Resumo)
Título: Bounding
the Distribution of Treatment Effects
- 09/05 Roberto Imbuzeiro
Oliveira (IMPA - RJ) (Resumo)
Título: Acoplamento
de caminhos e convergência ao equilíbrio de
passeios aleatórios sobre matrizes
- 09/04 Colóquio
Inter-institucional "Modelos Estocásticos e
Aplicações" (excepcionalmente as 13:30h no IMPA
sala 232)
- Renato Martins
Assunção (UFMG)
Título: Testes Monte Carlo sequenciais e de tamanho fixo
- Alexandra M. Schmidt (IM-UFRJ)
Título: Modelagem de processos espaciais e
espaço-temporais
- 28/03 Marlos
Viana (University of Illinois - USA) (Resumo)
Título: Aspectos
Estatísticos do Teorema da
Decomposição Canônica para Grupos
Finitos
Resumos
das Palestras do 1º semestre de 2007
Palestrante:
Bruno Sansó (UCSC - EUA)
Título: Spatially Varying
Temperature Trends in a Central California Estuary
Resumo
We consider monthly temperature data collected over a period of 16
years at 24 stations in the estuarine wetlands of the Elkhorn Slough
watershed, located in the Monterey Bay area in Central California, USA.
Our goal is to develop a statistical model in order to separate the
seasonal cycle, short term fluctuations and long term trends, while
accounting for the spatial variability of these features. In the model,
each station has a specific, time-invariant mixture of two seasonal
patterns, to encompass the spatial variability of oceanic influence.
Likewise, trends are modeled as local mixtures of two patterns, to
include the spatial variability of long term temperature change.
Finally, all stations share a common baseline, whose temporal
variability is linearly dependent on a variable that summarizes several
atmospheric measurements. We use a Bayesian approach with a purposely
developed Markov chain Monte Carlo method to explore the posterior
distribution of the parameters. We find that the seasonal cycles have
changed in time, that neighboring stations can have substantially
different behaviors and that most stations show significant
warming trends.
Palestrante:
Fernando
A. Moala (FCT - UNESP)
Título: Elicitação de
distribuições a priori multivariadas : Um procedimento
Bayesiano não-paramétrico
Resumo
A
elicitação de prioris é um importante
tópico da Inferência Bayesiana e tem sido
utilizada em muitas áreas aplicadas do conhecimento,
principalmente em situações nas quais os dados
experimentais não são tão numerosos
devido a dificuldade ou custo para obtê-los.
Através da elicitação o
estatístico pode incorporar formalmente a opinião
a priori de um especialista na forma de uma
distribuição de probabilidade. Há
vários métodos diferentes de se elicitar
distribuições a priori propostas na literatura; a
maioria deles para a construção de uma
distribuição a priori com apenas um
parâmetro desconhecido. Porém, há
poucos métodos para especificação de
uma distribuição a priori para vetores de
parâmetros desconhecidos. Além disso, muitos
desses métodos requer a
elicitação de momentos de segunda ordem e/ou a
elicitação de hiperparâmetros o qual
torna difícil sua aplicação
prática. É proposto um método mais
flexível de elicitar distribuições a
priori multivariadas aplicável a uma vasta classe
de problemas práticos. O método
não assume uma forma paramétrica para a
distribuição a priori desconhecida f(
. ). Sendo assim, é usado Inferência
Bayesiana Não-paramétrica, modelando f(
.) através de um processo Gaussiano a priori.
Dado um pequeno número de julgamentos do especialista, tais
como quartis de sua distribuição e três
ou quatro probabilidades conjuntas, obtém-se a
distribuição a posteriori para f( . ).
Propriedades teóricas das distriuições
a priori conjunta e marginais são determinadas e
também são apresentadas
ilustrações numéricas para demonstrar
o procedimento.
Palestrante:
Sergio Firpo (PUC - RJ)
Título: Bounding the Distribution of
Treatment Effects
Resumo
We use bounds on the distribution function of the sum of two random
variables with known marginal distributions obtained by Makarov (1981)
to bound the distribution function of the individual treatment effect.
Although the Makarov bounds are pointwise sharp if we only consider the
marginals, they can be improved by using the fact that we know the mean
(and only the mean) of the treatment effect distribution, i.e. the
Average Treatment Effect. We propose a procedure that uses this
additional information to obtain more informative bounds. We also show
that if the treatment effect varies with observable covariates,
averaging over these covariates improves the Makarov bounds. We can
combine the two types of additional information by using the known
conditional treatment effect means to improve the conditional Makarov
bounds and by subsequently averaging these conditional bounds. The
(improved) Makarov bounds on the cdf of the treatment effect
distribution yield bounds on the quantiles of that distribution.
Without covariates we can use the ATE to directly obtain bounds on
these quantiles, that turn out to be identical to the bounds obtained
by using the ATE to improve the cdf bounds. By this equivalence we can
use the average improved conditional Makarov bounds that use
information on the conditional ATE to improve the bounds on the
unconditional quantiles. Bounds on the conditional quantiles cannot be
averaged to obtain bounds on the unconditional quantiles. We illustrate
the qualitative features of the bounds for normal and dichotomous
outcome distributions."
Palestrante:
Roberto
Imbuzeiro Oliveira (IMPA - RJ)
Título: Acoplamento de caminhos e
convergência ao equilíbrio de passeios
aleatórios sobre matrizes
Resumo
Kac e Hastings propuseram um modelo de passeio aleatório
sobre matrizes de rotação em n
dimensões em que cada passo é uma
rotação por um ângulo
aleatório do plano gerado por duas coordenadas
aleatórias. Este passeio pode ser usado em problemas de
Física e Computação em que se busca
simular a distribuição uniforme (Haar) sobre
essas matrizes. Para isso, no entanto, é
necessário saber o quão rápido este
processo de Markov converge ao equilíbrio.
Mostraremos nesta palestra que a convergência se
dá em aproximadamente n^2 ln n passos de acordo com uma
certa métrica sobre distribuições. O
principal ingrediente da prova é uma forma de acoplamento
chamada de "acoplamento por caminhos" que adaptamos da literatura de
cadeias de Markov discretas. Acreditamos que esta técnica
pode ter muitas outras aplicações na
análise de métodos de Monte-Carlo sobre
espaços contínuos.
Palestrante:
Marlos
Viana (University of Illinois - USA)
Título: Aspectos
Estatísticos do Teorema da
Decomposição Canônica para Grupos
Finitos
Resumo
Este seminário apresentará um resumo das
aplicações estatísticas dos teorema da
decomposição canônica para grupos
finitos decorrentes de sua relação natural com a
teoria clássica de Fisher-Cochran sobre formas
quadráticas (análise de variância) e
com as noções de planejamentos de experimentos
presentes nos trabalhos seminais de R. Fisher. Resultados recentes
parecem identificar a teoria classical de planejamento de experimentos
com o estudo (via análise harmônica) de dados
indexados por grupos Abelianos finitos- de modo que essencialmente um
tipo de grupo define o experimento. O princípio de estudos
de simetria aqui exposto inclui a noção de grupo
experimental- na qual a escolha dos diversos grupos de
transformações (Abelianos ou não)
atuando nos diversos rótulos experimentais torna-se parte
integral do planejamento, análise e
interpretação dos experimentos.
2º
semestre de 2006
As palestras são realizadas
na
sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário
- 06/12
Prévias de Mestrado
Palestrante: Gilmar Jorge de Oliveira Jr. (Resumo)
Título: Soma
de variáveis aleatórias independentes:
aplicações
em atuária e finanças Palestrante:
Joaquim Henriques Vianna Neto (Resumo)
Título:
Modelagem Conjunta de Média e Variância: Uma
Aplicação ao Problema de
Estimação em Pequenos Domínios
- 22/11 Milan
Merkle (Professor Visitante - UFRJ) (Resumo)
Título: Spatial
medians and centers of multidimensional distributions
- 08/11
(excepcionalmente na sala C-100) Prévias de Mestrado
Palestrante:
Flavio B. Gonçalves (Resumo)
Título:
Análise
Bayesiana da Teoria de Resposta ao Item: uma Abordagem Generalizada
Palestrante:
Vinicius D. Mayrink (Resumo)
Título:
Aspectos
computacionais de modelos espaciais.
- 11/10 Adilson
Elias Xavier (COPPE Sistemas - UFRJ) (Resumo)
Título: Resolução
de problemas de agrupamento (clustering) via
suavização hiperbólica
- 04/10 Reunião
entre Alunos e Corpo Docente
- 20/09
Camilo
Daleles Rennó (DPI-INPE) (Resumo)
Título: Modelos
Hidrológicos Distribuídos
- 30/08 Mauricio Zevallos (IME -
Unicamp) (Resumo)
Título: Influential
observations in conditional heteroscedastic time series
- 17/08 Colóquio
Inter-Institucional Processos
Estocásticos e Aplicações Local: LNCC
a partir das 13:30h
Resumos
das Palestras do 2º semestre 2006
Palestrante:
Gilmar Jorge de Oliveira Jr.
Título: Soma de variáveis
aleatórias independentes: aplicações
em atuária e finanças
Resumo
A
teoria do risco tradicional assume que os riscos individuais de uma
carteira de seguro sejam independentes. A
determinação da função
distribuição dos sinistros agregados é
obtida através de recursões de Panjer
ou de De Pril, convoluções ou
aproximação por momentos. A tendência
moderna em atuaria é modelar
conjuntamente os riscos atuárial e
finaceiro, gerando, como veremos, somas de variáveis
aleatórias dependentes. Grande esforço
tem sido desenvolvido, na literatura recente, para determinar
limites superior e inferior para a
distribuição do sinistro agregado. Nesta
apresentação ilustraremos esses principios e
nossa proposta futura é fazer a inferência nesses
modelos, sobretudo do ponto de vista Bayesiano.
Palestrante:
Joaquim Henriques Vianna Neto
Título: Modelagem Conjunta de
Média e Variância: Uma
Aplicação ao Problema de
Estimação em Pequenos Domínios
Resumo
O termo pequenos domínios
(ou pequenas
áreas) é freqüentemente utilizado para
denominar áreas geográficas pequenas, tais como
municípios, distritos e bairros. Num sentido mais amplo,
é utilizado também para descrever um pequeno
subconjunto da população, podendo ser, inclusive,
resultado da classificação cruzada de duas ou
mais variáveis. As informações para
pequenas áreas podem ser obtidas a partir de censos e
enumerações populacionais, com a
população sendo inteiramente investigada, ou
através de pesquisas por amostragem. Pesquisas por
amostragem geralmente têm como principal
característica um tamanho de amostra reduzido nas pequenas
áreas; ou até mesmo a ausência de
unidades amostrais em algumas áreas. Dessa forma,
não é possível obter estimativas com
boa precisão a partir de estimadores diretos, baseados
unicamente no desenho da amostra. Uma alternativa
é utilizar uma abordagem que considere também as
estimações de regiões vizinhas no
espaço e no tempo. Para isso, são utilizados
aqui, modelos dinâmicos bayesianos de crescimento exponencial
com componentes que variam espacialmente segundo um processo gaussiano.
Particularmente, apresentamos uma aplicação
à dados do Censo Demográfico Brasileiro e da
Pesquisa Nacional por Amostra de Domicílios (PNAD), ambos
divulgados pelo Instituto Brasileiro de Geografia e
Estatística (IBGE). O objetivo é obter as
estimativas dos tamanhos populacionais dos municípios
incluídos na amostra da PNAD, combinando os dados da
pesquisa com aqueles dos censos. Ao utilizar dados de pesquisas com
diferentes variabilidades e tipos de erros, é preciso
considerar de modo diferenciado as precisões das
informações levantadas. Neste trabalho, propomos
uma modelagem conjunta de média e variância para
identificar a quantidade de informação de um
estimador a partir da estimativa de sua variância.
Palestrante:
Milan
Merkle (Universidade de Belgrado)
Título: Spatial medians and centers
of multidimensional distributions
Resumo
In a recent statistical literature, several concepts of a median of a
multidimensional data set or a distribution have been introduced. The
idea is always to select one determining property of the median of a
real valued random variable and then try to generalize it in more
dimensions. However, properties that are equivalent in one dimension
are not necessarily equivalent in higher dimensions, and this is the
reason why none of approachesmakes a definitive solution to defining
what is also known as a center of multidimensional data set or a
multivariate distribution. The talk is about yetanother approach, where
we start with a novel equivalent definition of a median in a univariate
case, extend it to multivariate, and then show a numberof interesting
results in theory and applications. We discuss some properties of Type
D depth functions introduced by Zuo and Serfling, Ann. Statistics
28 (2000), 461--482, and we show that the only reasonably
well behaved depth function of this type is the halfspace depth.
Palestrante:
Flavio
B. Gonçalves (Pós-Graduação
- UFRJ)
Título: Análise Bayesiana da
Teoria de Resposta ao Item: uma Abordagem Generalizada
Resumo
Nesta dissertação é feito um estudo
generalizado da Teoria de Resposta ao Item (TRI) através de
propostas que permitam a modelagem do funcionamento diferencial do item
– DIF (Differential Item Functioning) no contexto da TRI
usando uma abordagem bayesiana. Primeiramente, é proposto um
modelo de TRI que considera a existência de DIF(na
discriminação e na dificuldade),
porém, assumindo-se a hipótese de que os itens
com DIF são conhecidos. São feitos estudos de
simulação paraanalisar a eficiência do
modelo e da metodologia utilizada para se fazer a inferência.
Além disso, omodelo é aplicado para a
análise de um conjunto de dados reais referente ao Programa
Nova Escola do Estado do Rio de Janeiro. Posteriormente, é
propostoum modelo que engloba a detecção de itens
com DIF, ou seja, que não necessite da hipótese
de se conhecer quais itens possuem funcionamentodiferencial. Novamente,
são feitos estudos de simulação com
tal modelo e também a análise do mesmo conjunto
de dados reais.
Palestrante:
Vinicius D. Mayrink (Pós-Graduação -
UFRJ)
Título: Aspectos computacionais de
modelos espaciais.
Resumo
Nos últimos tempos vem crescendo o número de
aplicações práticas realizando
análises de dados espacialmente distribuídos em
uma área. Diferentes modelagens podem ser determinadas
dependendo do tipo de problema que se deseja estudar. A modelagem
considerada neste trabalho leva em conta a divisão desta
área em n regiões. Para cada
região a variável de interesse
é
observada sendo
o
conjunto completo de observações.A estrutura de
vizinhança que estabelece a relação de
dependência entre as observações
é um aspecto importante a ser considerado. O estudo de uma
série de dados observados objetiva modelar e analisar esta
dependência. A estrutura espacial mais simples é
configurada da seguinte forma: A i-ésima
observação,
,
apresenta dois vizinhos que são
e
. Perceba que esta particular estrutura representa também
uma série temporal com n
observações, que está na classe dos
Modelos Dinâmicos Lineares (MDL's).
Estruturas de vizinhanças mais complexas podem ser
consideradas, isto é, uma observação
qualquer apresenta três ou mais vizinhos. Neste caso devem
ser utilizados modelos espaciais com estrutura de vizinhança
mais geral. Levando em consideração as diferentes
possibilidades de especificação de uma estrutura
espacial surge a seguinte reflexão: Quando uma
área dividida em n regiões
é analisada pode-se ter estruturas de vizinhanças
mais simples, onde a maioria das regiões apresenta no
máximo dois vizinhos, ou estruturas mais gerais onde o
número de vizinhos é grande. Existiria
influência da quantidade de vizinhos sobre o desempenho do
modelo espacial utilizado? Que tipo de alterações
observam-se nos resultados fornecidos ou nos algoritmos utilizados por
estes modelos conforme o número de vizinhos é
aumentado? A busca pela resposta destas questões tornou-se o
principal objetivo que motivou o desenvolvimento deste trabalho.
A
análise bayesiana é empregada aqui e
três esquemas, propostos na literatura, serão
utilizados para a amostragem da distribuição a
posteriori dos parâmetros do modelo. Estes esquemas
diferem-se basicamente na estrutura de blocagem dos
parâmetros que podem ser amostrados separadamente ou
conjuntamente. É por meio deles que será estudado
o desempenho dos modelos espaciais e dos algoritmos MCMC por eles
utilizados perante diferentes quantidades de vizinhos.Iniciando pela
aplicação de um modelo espacial simples este
trabalho desempenha também uma extensão estudando
o modelo espacial com componente de regressão
múltipla. Diferentes aspectos são considerados
para análise, entre eles estão resultados de
inferência, verificação de
convergência e análise da estrutura de
autocorrelação das cadeias obtidas.
Palestrante:
Adilson
Elias Xavier (COPPE Sistemas - UFRJ)
Título:
Resolução de problemas de agrupamento
(clustering) via suavização hiperbólica
Resumo
Nesta
palestra, será considerado o Problema de Agrupamento
(Clustering) segundo o critério de mínima soma de
quadrados dentro dos grupos, ou equivalentemente,
minimização da variância intragrupos.
Esse critério, sendo muito natural, é o mais
freqüentemente usado nas formulações de
problemas de agrupamento. Adicionalmente à significante
característica de sua natureza bi-nível, o
problema associado tem a característica de ser fortemente
não-diferenciável. A fim de superar essas
dificuldades, a nova metodologia de resolução
proposta adota uma estratégia de
suavização usando uma especial
função completamente diferenciável.
Com
o propósito de demonstrar a eficiência e a
robustez do método, resultados computacionais obtidos na
resolução de um conjunto canônico de
problemas teste, descritos na literatura, são apresentados.
Palestrante:Camilo
Daleles Rennó (DPI-INPE)
Título: Modelos
Hidrológicos Distribuídos
Resumo
Os modelos hidrológicos são ferramentas
úteis para o entendimento do comportamento
hidrológico de bacias hidrográficas. Estes
modelos deveriam representar grande parte dos processos
hidrológicos a fim de produzir resultados realistas.
Entretanto, os modelos são apenas uma
aproximação da realidade e requerem uma boa
inicialização das variáveis de estado
e uma grande quantidade de dados para representar apropriadamente os
processos envolvidos. Esta apresentação visa
discutir as diferentes abordagens utilizadas na
construção de modelos hidrológicos
distribuídos. Inicialmente, será apresentado o
ciclo hidrológico e seus componentes. Aspectos relativos a
discretização espacial e temporal
serão também discutidos. Especificamente,
serão apresentados os resultados do desenvolvimento do
sistema SASHI (Sistema de Análise e
Simulação Hidrológica). O enfoque
principal é mostrar as diferenças das
variáveis que alimentam modelos deste tipo.
Palestrante:
Mauricio Zevallos (IME - Unicamp)
Título: Influential observations in
conditional heteroscedastic time series
Resumo
This paper examines local influence in exponential generalized
autoregressive conditional heteroscedasticity (EGARCH) models. The
analyses of local influence is discussed under three perturbations
schemes: data perturbation and innovative and additive model
perturbation. For each case expressions for slope and curvature
diagnostics are derived. Monte Carlo experiments are presented in order
to determine threshold values for locating influential observations. In
addition, the empirical study of daily returns of the New York Stock
Exchange composite index shows that local influence analyses is an
important device for determining and classifying shocks in the market.
1º
semestre de 2006
As palestras são realizadas
na
sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário
- 07/07 (excepcionalmente as 15h)
J Andres Christen (CIMAT-Mexico) (Resumo)
Título: Radiocarbon
peat chronologies and environmental change
- 21/06 Antonio Miguel Vieira
Monteiro (INPE) (Resumo)
Título: Tecnologias
da informação espacial e estatística:
experimentos com territórios digitais
- 21/06 (excepcionalmente
as 11h) (Exame de Qualificação) Ramiro Ruiz
Cárdenas (UFRJ)
Título: Redesenho
ótimo de redes de monitoramento ambiental
- 20/06 (excepcionalmente as 14h)
(Defesa de Tese de Doutorado) Mariane B. Alves (UERJ/UFRJ)
Título: Funções
de transferência em modelos dinâmicos lineares
generalizados
- 19/06 (excepcionalmente as 14h) (Exame de Qualificação) Edna Afonso Reis
(UFMG/UFRJ) (Resumo)
Título: Modelagem
Bayesiana Dinâmica da Variação
Temporal
no Processo Espacial Pontual de Cox Log-Gaussiano
- 17/05 (excepcionalmente
as 14h) Colóquio
Inter-Institucional: Modelos Estocásticos e Aplicações
Marina
S. Paez (IM-UFRJ) (Resumo)
Título:
Cox processes in time for point patterns and their aggregations
Glauco Valle (IM-UFRJ) (Resumo)
Título:
Estimativas e resultados de convergência para o modelo do
votante
- 10/05 Antonio Ponce de Leon
(IMS-UERJ) (Resumo)
Título: Planejamento Ótimo de Experimentos para
Modelos com Estrutura Complexa de Variância
- 12/04 (excepcionalmente as 15h no Salão Nobre do CCMN)
Ruben
Klein (Cesgranrio/LNCC/MCT) (Resumo)
Título: Avaliação
e diagnósticos de desempenho
- 03/04 (excepcionalmente 2a feira)
Teddy
Seidenfeld (Carnegie Mellon University - EUA) (Resumo)
Título: Multi-agent decision
making and other settings for relaxing Bayesian
theory
- 23/03 (excepcionalmente 5a
feira) Raquel Montes Diez (URJC - Espanha) (Resumo)
Título: Bayesian Analysis of
non-linear autoregression models based on neural networks
- 09/03 Dani
Gamerman e Corpo Docente PG-Estatística
Título:
Apresentação do Programa de
Pós-Graduação em
Estatística do IM-UFRJ aos novos alunos
Resumos
das Palestras do 1º semestre de 2006:
Palestrante:
J Andres Christen (CIMAT-Mexico)
Título: Radiocarbon peat
chronologies and environmental change
Resumo
Raised bog peat deposits form important archives for reconstructing
past climate changes. Precise and reliable age-models are of vital
importance for interpreting such archives. We propose enhanced,
MCMC-based methods for obtaining age-models from radiocarbon-dated peat
cores, based on the assumption of piece-wise linear accumulation.
Included are automatic choice of sections, a measure of the
goodness-of-fit, and outlier downweighting. Moreover, once
having the age model at hand, the MCMC samples are used to plot pollen
records from he peat core so as to obtain pollen levels along the
calendar scale taking into account the variablity and unciertanties in
the dataing. The variability of pollen counts over time is
then used as a proxy for climatic change which in turn can be observed
within some noise levels.
Palestrante:
AntonioMiguel Vieira Monteiro(INPE)
Título: Tecnologias da
informação espacial e estatística:
experimentos com territórios digitais
Resumo
"O BraSil não
conhece o BraSil". E isto é muito grave. As
implicações são diretas para a
gestão, organização e ordenamento do
território brasileiro,com refelxos diretos na vida dos
municipios e de cada cidadão. Como dizia o saudoso Mestre
Milton Santos, "O território é o dado essencial
dacondição da vida cotidiana". Então
como conhecer o Brasil sem conhecer os Territórios
Brasileiros? Esta palestra vai procurar mostrar que esta
nãoé uma tarefa exclusiva dos
geógrafos e cientistas sociais, e tenta tratar a
questão de como podem Cientistas com origem nas
Ciências Naturaisauxiliar na construção
e acúmulo de conhecimento sobre a realidade brasileira a
partir do conceito de “Territórios
Digitais” e de suasrepresentacionais
matemático-computacionais. Vamos ilustrar o tipo de
problemas que enfrentamos , as ferramentas que podem nos ajudar, o
poucojá feito e o muito que precisamos ainda fazer.
Esperamos mostrar oportunidades de trabalhos de pesquisa e
desenvolvimento em diferentes áreas daCiência da
Computação e das Ciências
Matemáticas e Estatísticas e da necessidade de
sua estreita colaboração. Apresentaremos exemplos
de um ambiente aberto
promovido pelo INPE e parceiros que é nossa plataforma
computacional para o desenvolvimento dos experimentos com o
conceitoaqui apresentado, a TerraLib, e um exemplo de
interação entre grupos das
ciências médicas e sociais,
matemáticos e estatísticos e
gruposdeEngenharia e Computação para
responder questões relevantes nos territórios da
saúde pública, da segurança
pública, dos indicadoresde exclusão
esegregação social em cidades e na modelagem da
dinâmica de uso e cobertura da
terra na Amazônia Brasileira.
Palestrante:
Edna
Afonso Reis (UFMG/UFRJ)
Título: Modelagem Bayesiana Dinâmica
da Variação
Temporal no Processo Espacial Pontual de Cox
Log-Gaussiano
Resumo
Apresentamos
um modelo de Cox log-gaussiano dinâmico para dados espaciais
pontuais observados em diferentes instantes de tempo em uma
região. O modelo é especificado por uma
seqüência de superfícies de
log-intensidade espaciais ligadas através do tempo e
modeladas por processos gaussianos dinâmicos. A
inferência é feita sob a abordagem Bayesiana, que
incorpora naturalmente a característica
estocástica da função de intensidade
nestes processos. As log-intensidades e hiperparâmetros do
modelo são estimados a partir de amostras de suas
distribuições a posteriori, obtidas
através de métodos Monte Carlo via cadeias de
Markov, como o amostrador de Gibbs, com uso de passos de
Metropolis-Hastings. Em particular, duas propostas de densidades para
amostragem da posteriori das log-intensidades são
apresentadas e comparadas. Uma delas amostra as log-intensidades de sua
priori condicional, enquanto a outra é baseada no algoritmo
iterativo de mínimos quadrados ponderados para modelos
lineares generalizados mistos. Estes modelos se aplicam a arranjos
espaciais pontuais nos quais a agregação dos
eventos é devida à heterogeneidade espacial da
intensidade do processo, sem a existência de
correlação espacial direta entre eles. Um exemplo
são os arranjos espaciais de casos de doenças
não-contagiosas, que aparecem agregados porque a intensidade
de ocorrência na região varia espacialmente como
resultado das variações em
características ambientais,
sócio-econômicas ou outras que determinam o
surgimento e crescimento da doença.
Palestrante:
Marina S. Paez (IM-UFRJ)
Título: Cox processes in time for
point patterns and their aggregations
Resumo
We propose a Cox process as a model for the temporal pattern of the
incidence of cases of events of a certain type and develop associated
methods of Bayesian inference, which we implement using an MCMC
algorithm. For problems of this kind, the data may consist of the
event-times themselves, or counts of the numbers of events in disjoint
time-intervals. We explore the consequences of working with different
levels of temporal aggregation of the data. We use a
simulated example to demonstrate the feasibility of our methodology,
which we then apply to data giving daily counts of incident cases of
gastrointestinal infections in the county of Hampshire, UK.
Palestrante:
Glauco Valle (IM-UFRJ)
Título: Estimativas e resultados de
convergência para o modelo do votante
Resumo
Nós estudamos a evolução das
interfaces para o modelo do votante em dimensão um,
mostrando que se o núcleo do passeio aleatório
associado com o modelo do votante tem momento de ordem superior a 3
finito então os extremos da interface convergem fracamente
para um movimento Browniano em escala difusiva.
Palestrante:
Antonio
Ponce de Leon (IMS-UERJ)
Título: Planejamento
Ótimo de Experimentos para Modelos com Estrutura Complexa de
Variância
Resumo
Nesta palestra alguns avanços recentes na teoria de
planejamento ótimo de experimentos são
apresentados. Vários métodos para obter
experimentos ótimos para modelos com estruturas de
variância e covariância simples bem como as
propriedades destes experimentos já foram desenvolvidos ao
longo das três ou quatro décadas. Portanto, a
pesquisa na área tem sido no contexto de modelos com
estruturas de variância mais complexas. Alguns
exemplos de soluções de problemas neste contexto
serão discutidos. O primeiro consiste em experimentos
ótimos para modelos lineares generalizados com
espeficação conjunta da média e
variância. A segunda referência está
relacionada com experimentos com respostas observadas ao longo do tempo
e mensuradas continuamente. Finalmente, o terceiro tema abordado
consiste em experimentos com respostas multivariadas. Outros problemas
similares serão mencionados ao final da palestra.
Palestrante:
Ruben
Klein (Cesgranrio/LNCC/MCT)
Título:
Avaliação e diagnósticos de desempenho
Resumo
Nesta palestra, introduziremos noções de
avaliação de desempenho, análise de
itens segundo a Teoria Clássica de Testes e a Teoria de
Resposta ao item e a interpretação de uma escala
de desempenho. Ilustraremos as análises com
exemplos.
Palestrante:
Teddy Seidenfeld (Carnegie Mellon University - EUA)
Título: Multi-agent decision making
and other settings for relaxing Bayesian theory
Resumo
I discuss why choice functions (that is, generalized decision rules)
need to have at least a local Bayes model. I provide a
deFinetti-style standard of coherence (= avoiding uniform dominance)
for choice functions generally, a result that has the broad scope found
in Wald's Complete Class Theorems. Second, I present a
challenge for cooperative Bayesian partnerships, which serves to
motivate the need to relax the canonical Bayesiantheory but without
sacrificing coherence. Last, I sketch a theory of coherent
choice functions – which is work in progress -- as one way to
meet thischallenge.
Palestrante:
Raquel Montes Diez (URJC - Espanha)
Título: Bayesian Analysis of
non-linear autoregression models based on neural networks
Resumo
In this paper, we show how Bayesian neural networks can be used for
time series analysis. We consider a block based model building strategy
to model linear and nonlinear features within the time series: a linear
combination of a linear autoregression term and a feedforward
neural network(FFNN) with an unknown number of hidden nodes. To allow
for simpler models, we also consider these terms separately as
competing models toselect from. Model identifiability problems arise
when FFNN sigmoidal activation functions exhibit almost linear
behaviour, or when there are almostduplicate or irrelevant neural
network nodes. New reversible jump moves are proposed to facilitate
model selection mitigating model identifiability problems. We
illustrate this methodology analyzing several time series data
examples.
2o.
semestre de 2005
As palestras são realizadas
na
sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário
- 07/12 Adriano Ferreti
Borgatto (INE-UFSC) (Resumo)
Título: Estimação
Bayesiana para modelos de proporções e contagens
com excesso de zeros
- 23/11 José Ailton A. de Andrade
(UnB)
(Resumo)
Título:
Modelagem robusta bayesiana usando distribuições
de variação regular
- 09/11 Prévias
de Mestrado (Resumos)
- Valmária Rocha da Silva "Uma
abordagem condicional para valores extremos multivariados: uma
aplicação na modelagem dos níveis
extremos de chuva" (Beatriz Vaz de Melo Mendes)
- Carlos Henrique Azevedo Gomes "Estimação bayesiana com priori
de Jeffreys em modelos de espaço de estados"
(Marco A. R. Ferreira)
- 26/10 Prévias
de Mestrado (Resumos)
- Ana Paula dos Santos Rubem (Beatriz Vaz
de Melo Mendes)
- Carla de Souza Lôbo:
"Modelagem bayesiana de evolução de taxas de
mortalidade. Estudo de caso:
doenças do aparelho circulatório no RJ" (Helio S.
Migon e Dani Gamerman)
- 21/10 (Excepcionalmente
6a feira -13h - C116) Prévias de
Mestrado (Resumos)
- Marcus Vinicius M. Fernandes: "Modelos
Espaço-Temporais Inflacionados de Zeros" (Alexandra M.
Schmidt e Helio S. Migon)
- Carolina P. Ornelas: "Modelos
Bayesianos Semi-Paramétricos" (Alexandra M. Schmidt e
Mariane B. Alves)
- 28/09 Francisco
Louzada Neto (DE-UFSCar)(Resumo)
Título: Uma
Classe de Modelos de Riscos Não-Proporcionais Dependentes do
Tempo
- 21/09 Denise Britz do
Nascimento Silva (ENCE-IBGE) (Resumo)
Título: Estimativas
da Taxa de Desocupação para Pequenos
Domínios via Modelos de Espaço de Estados
- 26/08 Manuel
Morales (York University/University of Montreal) (Resumo)
Título:
Generalized Risk Models, Levy Processes and the Discounted Penalty
Function.
- 10/08
Eugenio Caner, DSc. (Consultor Sênior Bayes
Forecast) (Resumo)
Título:
Bayes Forecast - um novo enfoque em comercializar
estatística.
1º semestre de 2005
As palestras são realizadas
na
sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário
- 29/06
Rosemary Bailey (School of Mathematical Sciences, Queen Mary,
University of London) (Resumo)
Título:
Design of field experiments in the presence of interference
between treatments.
- 22/06 Bruno
Mendes (UCSC-EUA) (Resumo)
Título:
A Bayesian solution to an inverse problem in groundwater
contamination modeling.
- 25/05 Tufi
Machado Soares (UFJF) (Resumo)
Título:
Aplicações de MCMC na
estimação de modelos para a análise do
comportamento diferencial do item.
- 05/05
Carlos Alberto de Bragança Pereira (IME-USP) (Resumo)
Título:
Significância Bayesiana
- 27/04
Oswaldo G. Cruz (PROCC-Fiocruz) (Resumo)
Título:
Modelagem Espaço-Temporal dos homicídios
região Sudeste/Brasil, 1979-1998.
- 20/04 Sacha
Friedli (Resumo)
(Concurso para Professor Visitante do DME-UFRJ)
Título:
Truncamento em Sistemas com Interações
não-somáveis.
- 13/04
Josemar Rodrigues - UFSCar (Resumo)
Título: Bayesian
Inference: A journey beyond normality, dependence and precise hypotheses
- 23/03 Marc
Suchard - UCLA, EUA (Resumo)
Título:
Statistical solutions to fundamental difficulties in evolutionary
reconstruction models
- 09/03 Dani
Gamerman e Corpo Docente PG-Estatística
Título:
Apresentação do Programa de
Pós-Graduação em
Estatística do IM-UFRJ aos novos alunos
Resumos das Palestras do
2º
semestre de 2005:
Palestrante:
Adriano Ferreti Borgatto (INE-UFSC)
Título:
Estimação Bayesiana para modelos de
proporções e contagens com excesso de zeros
Resumo
Neste trabalho, três modelos foram considerados para
análise de um conjunto de dados obtido de um ensaio de
controle biológico para Diatraea saccharalis,
uma praga comum em plantações de
cana-de-açúcar. Usando-se o modelo binomial, um
ajuste adequado não pôde ser obtido, devido
à superdispersão gerada pela variabilidade da
média e pelo excesso de zeros. O segundo modelo foi o
beta-binomial que leva em consideração a
variabilidade da média e o terceiro foi o modelo
beta-binomial inflacionado de zeros (ZIBB). Um outro conjunto de dados
proveniente de um experimento para o controle de pragas na
produção de milhos avaliados ao longo do tempo
foi utilizado, sendo a variável resposta o número
de lagartas. Neste caso, devido ao excesso de respostas zero,
empregou-se o modelo Poisson inflacionado de zeros (ZIP),
além do modelo Poisson padrão e devido aos dados
serem observados ao longo do tempo incluiu-se o modelo ZIP com efeito
aleatório. A estimação dos
parâmetros dos modelos foi realizada através da
abordagem Bayesiana, usando-se métodos de Monte Carlo com
Cadeias de Markov (MCMC) e para a seleção dos
modelos usou-se o fator de Bayes. A convergência da cadeia
foi diagnosticada através da análise
gráfica dos valores gerados e dos diagnósticos
apropriados implementados no módulo CODA
disponíveis no software R.
Palestrante:
José Ailton A. de Andrade
( UnB)
Título:
Modelagem robusta bayesiana usando distribuições
de variação regular
Resumo
Em grande
parte dos modelos estatísticos as quantidades de interesse
são os parâmetros de escala e de
locação (ou alguma função
desses). Neste trabalho nós estudamos modelos de
locação e escala na presença de
informações conflitantes. Em termos
simples, dizemos que duas fontes de informação (por ex. dados
e informação a priori) estão em conflito se
elas carregam informações muito discrepantes
sobre o mesmo parâmetro; em termos probabilísticos
isso basicamente significa que as funções
(verossimilhanças/densidades) que carregam
informações sobre o parâmetro de
interesse estão concentradas longe umas das outras. Veja
O'Hagan e Forster (2004) para maiores detalhes. Quando esse problema
ocorre, se modelarmos tradicionalmente (usando
distribuições da familia exponencial), a
distribuição a posteriori pode ser fortemente
influenciada pela informação
conflitante, e potencialmente levar a conclusões erradas. A
literatura sobre esse problema tem se concentrado em estabelecer condições
nas distribuições do modelo para que a
distribuição a posteriori descarte
automaticamente a informação que estaria causando
o conflito. No entanto, essas condições
propostas, além de serem difíceis de aplicar,
têm se concentrado basicamente em modelos de
locação. Neste trabalho, nós
introduzimos a teoria de variação regular no
contexto de modelagem robusta bayesiana, o que nos permite uma
interpretação muito mais fácil de
modelagem usando caudas pesadas. Como consequência, em
modelos de locação e escala, nós
propomos condições suficientes nas
distribuições do modelo que resultam na
resolução do conflito rejeitando automaticamente
a informação conflitante. Todas as formas de
conflitos serão consideradas, isto é conflitos
causados tanto pelos dados (outliers) ou pela
informação a priori.
Prévias
de Mestrado
Uma
abordagem condicional para valores extremos multivariados: uma
aplicação na modelagem dos níveis
extremos de chuva
Valmária Rocha da
Silva
A Teoria dos Valores Extremos Multivariados e seus métodos
tratam da
caracterização, estimação e
extrapolação das "caudas conjuntas" da
distribuição
multidimensional. As abordagens existentes são baseadas em
argumentos limites
em que todas as váriáveis são
extremas. Iremos aplicar a proposta de um modelo
multivariado para situações em que pelo menos uma
das variáveis é extrema,
desenvolvido por Heffernan e Tawn, 2004. O cálculo
correto das probabilidades
dos eventos extremos ocorrem em diversas
aplicações, a aplicação que
consideramos
aqui é em relação a riscos
hidrológicos. Nós examinamos os níveis
de três
rios provocam inundações em Porto Rico,
os rios Fajardo, Canovanas e Espirito
Santo, os quais monitoram as situações de
enchente nessa região, durante
o período de abril de 1967 a setembro de 2002, inclusive.
Estimação bayesiana com priori de Jeffreys em
modelos de espaço de estados
Carlos Henrique Azevedo Gomes
Neste trabalho, desenvolvemos a priori de Jeffreys para a
estimação Bayesiana em modelos espaço
de estados. A priori de Jeffreys é obtida a partir da Matriz
de Informação esperada de Fisher (MI).
Como em geral em modelos espaço de estados
MI não possui uma forma analítica
fechada a calculamos via filtro de Kalman como proposto em [CAVANAUGH
& SHUMWAY, Statistics and Probability Letters 26 (1996)
347-355]. Calcular MI, no entanto,
é muito demorado e por isso estudamos também a
priori obtida substituindo-se MI pela matriz de
informação observada de Fisher. A priori assim
obtida pode ser considerada uma aproximação para
a priori de Jeffreys. Consideramos vários estimadores
Bayesianos, como a moda, a média e a mediana a posteriori,
obtidos a partir dessas prioris e também, para efeito de
comparação, da priori uniforme. Note que quando a
priori uniforme é utilizada, a moda a posteriori coincide
com o estimador de máxima verossimilhança.
Comparamos para alguns casos particulares de modelos de
espaço de estados a performance dos vários
estimadores obtidos. Resultados preliminares indicam que o desempenho
dos estimadores depende da razão sinal-ruído.
Porém, de uma forma geral, o EMV é muito bom para
estimar o estado latente no tempo inicial, enquanto que a
média a posteriori com priori de Jeffreys é
melhor para estimar as variâncias das
pertubações.
Modelagem bayesiana de
evolução
de taxas de mortalidade. Estudo de caso: doenças do aparelho
circulatório
no RJ
Carla de Souza Lôbo
Atualmente, as doenças do aparelho circulatório
são as principais causas
de morte no Brasil. Entretanto, tem sido observado um
declínio da mortalidade
por essas doenças. Nota-se que este
declínio acontece de forma diferenciada
para cada faixa etária da população,
dependendo também do período considerado.
A modelagem do declínio destas taxas no Rio de
Janeiro, no período de 1980
a 2002, para cada faixa etária, é o
objeto deste estudo. As análises se
dividem em duas abordagens. A primeira é baseada no conceito
do fator de
redução de mortalidade, utilizado por Renshaw e
Haberman (2003), onde modela-se
o número de mortes como um modelo linear generalizado
Poisson com sobredispersão. Na segunda abordagem, a
força de mortalidade é avaliada
utilizando modelos
de crescimento exponencial generalizados. Conceitos de modelagem
dinâmica
bayesiana serão empregados em ambas as abordagens.
Modelagem de valores extremos baseada nas r maiores
estatísticas de ordem: Uma aplicação
no cálculo do valor em risco em mercadosemergentes
Ana Paula dos Santos Rubem
ATeoria de Valores Extremos
é um ramo da probabilidade que estuda o comportamento
estocástico de extremos associados à uma
distribuição F. Na prática,
F é desconhecida, tornando os cálculos
exatos impossíveis. No entanto, sob certas
suposições, o comportamento aproximado do
máximo, ou mais geralmente, das r maiores
estatísticas de ordem, é descrito por uma
família de distribuições conhecida. As
abordagens existentes em finanças são
geralmente baseadas nos máximos e
mínimos. Iremos aplicar o modelo para as r-maiores
estatísticas de ordem proposto por Smith (1986), para o caso
Gumbel, a partir dos desenvolvimentos teóricos de Weissman
(1978), e generalizado por Tawn (1988), para avaliar a
influência da inclusão das r-maiores
estatísticas de ordem no cálculo de medidas de
risco. Examinaremos os índices de cinco países
que compõem o chamado mercado emergente, Argentina, Brasil,
Chile, Índia e Singapura, no período de 31 de
dezembro de 1993 a 31 de dezembro de 2005. A análise se
divide em duas partes. Primeiro, iremos utilizar
estimação por máxima
verossimilhança e supor o vetor de parâmetros
constante no tempo. Depois, iremos supor ser o vetor de
parâmetros uma função suave no tempo,
mas não-paramétrica, usando métodos de
verossimilhança local como proposto por Heffernan et al
(2004).
Modelos Bayesianos
semi-paramétricos
Carolina P. Ornelas
Embora os modelos lineares generalizados
sejam
capazes de contornar o
problema de não normalidade da variável resposta,
ainda assim estes apresentam
restrições. Uma delas reside no fato de que, em
diversas situações, tem-se
variáveis explicativas que não impactam a
resposta média de forma linear.
Além disso, para algumas variáveis o foco
não está na estimativa dos efeitos
das mesmas, mas apenas na consideração da
possível existência destes efeitos.
A classe dos Modelos Aditivos Generalizados proposta por
Hastie e Tibshirani
(1990) permite que o preditor linear seja substituído por um
preditor aditivo,
composto pela soma de funções s quaisquer, sendo
as funções suaves as mais
indicadas. O presente trabalho propõe-se a estudar
uma forma de trabalhar
com variáveis que são incorporadas de forma
não-paramétrica no modelo. A
abordagem de estimação utilizada é
bayesiana e os modelos são ajustados a
um conjunto de dados de mortalidade de São Paulo, com
observações feitas
no período de 01 de janeiro de 1994 a 31 de dezembro de
1997. Os resultados
obtidos são comparados aos mesmos modelos ajustados segundo
o enfoque clássico,
e uma segunda aplicação é feita
utilizando uma série mensal de chuva e vazão
observada na bacia do Rio Grande (BA), no período de agosto
de 1984 a setembro
de 2004.
Modelos Espaço-Temporais
Inflacionados
de Zeros
Marcus Vinicius M. Fernandes
Este trabalho tem como objetivo modelar processos (fenômenos)
que se caracterizam pela variação no tempo e no
espaço e pela presença excessiva de zeros.
Utiliza-se uma mistura de distribuições,
incluindo massa de probabilidade no ponto 0(zero).
Serão abordados modelos para
variáveis contínuas (exponencial, gama,
log-normal) e discretas (poisson), utilizando processos gaussianos e
efeitos autoregressivos condicionais (CAR), no âmbito da
dependência espacial. É adotada a abordagem
bayesiana, com a utilização de métodos
de Monte Carlo via Cadeia de Markov (MCMC). Aplicaremos o(s) modelo(s)
a dados de chuva da cidade do Rio de Janeiro, para variávies
contínuas e dados de dengue, também da cidade do
Rio de Janeiro, para variáveis discretas. Ao final do estudo
é feita a modelagem conjunta de dengue e chuva, examinando o
excesso de zeros em ambos os casos.
Palestrante:
Francisco Louzada Neto
(DE-UFSCar)
Título:
Uma Classe de Modelos de Riscos Não-Proporcionais
Dependentes do Tempo
Resumo
Neste seminário discutimos uma nova família
paramétrica de modelo de risco
não-proporcional dependente do tempo (McKenzie, 1999). O
modelo é baseado
na generalização da função
logística usual e é motivado, em parte, pela
necessidade
de se considerar o efeito do tempo na modelagem, e, em parte, pela
preferência em se considerar uma estrutura
paramétrica para a função de risco.
Vários
procedimentos inferenciais relacionados a esta nova família
de modelos são
apresentados.
Palestrante:
Denise Britz do
Nascimento Silva - IBGE
Título:
Estimativas da Taxa de
Desocupação para Pequenos Domínios via
Modelos de Espaço de Estados
Resumo
O Instituto Brasileiro de Geografia e Estatística
– IBGE enfrenta constantemente
o desafio de produzir estimativas com alto nível de
precisão para pequenos
domínios ou áreas. Pequenos domínios
são aqueles para os quais não se consegue
obter estimativas para os parâmetros de interesse, com a
precisão adequada,
através de procedimentos tradicionais de amostragem. Este
trabalho tem por
objetivo desenvolver modelos de séries temporais para
estimação em pequenos
domínios em pesquisas amostrais repetidas. A
série utilizada neste trabalho
é proveniente da Pesquisa Mensal de Emprego – PME,
no período de janeiro
de 2000 a fevereiro de 2005. O método foi desenvolvido para
fornecer estimativas
da taxa de desocupação, por sexo, sob a
restrição de que as estimativas obtidas
sejam compatíveis com a taxa de
desocupação referente ao total da
população
publicada pelo instituto (benchmarking).
Palestrante:
Manuel Morales (York
University/University of Montreal)
Título:Generalized
Risk Models, Levy Processes and the Discounted Penalty Function.
Resumo
We will review, from a historical point of view, the use of Levy
processes in ruin theory. We focus on the decomposition for the ruin
probability and we argue how its convolution structure is inherited
from the Levy family
of processes. We will discuss the notion of discounte penalty
function in
the framework of Levy risk processes. The problem of finding
expressions for this function in a risk model driven by a Levy process
will be addressed. Examples for which these expressions are available
will be discussed. Expressions for the joint density of the process
prior and at ruin are presented for
a few examples. These include the gamma process and the inverse
Gaussian
process. Finally, forms of the discounted penalty function in a more
general
setting will be discussed.
Palestrante:
Eugenio Caner, DSc.
Título: Bayes
Forecast - um novo enfoque
em comercializar estatística
Resumo
A palestra apresentará a empresa Bayes Forecast que
está iniciando suas
operações no Brasil. A Bayes Forecast,
é uma empresa de Business Intelligence
Quantitativo, especializada no desenvolvimento de sistemas de
previsão,
atenção e monitoramento da demanda,
gestão dos investimentos de publicidade
entre outras aplicações.
Tratará sobre histórico, sua
identidade, o enfoque
de comercializar seus serviços, sua filosofia de modelagem
aberta e ferramentas open source. Abordaremos algumas das
soluções implementadas em seus clientes
e também as perspectivas de
contratação de profissionais de
estatísticas.
Resumos
das Palestras do 1º semestre de 2005:
Palestrante:
Rosemary Bailey
Título: Design
of field experiments in
the presence of interference between treatments.
Resumo
In many types of field experiment it is likely that the treatment
applied to one plot will affect neighbouring plots as well as the plot
to which it is applied. Such an effect is variously
called a neighbour effect,
or interference between treatments, or competition between
treatments.
Where such effects exist, we need not only to model them in the
analysis
but also to design the experiment with the neighbour effects in
mind. This
talk will give examples from various different types of
treatment, discuss
some of the issues, and give some recommendations for design,
some derived
theoretically, some more ad hoc.
Palestrante:
Bruno Mendes
Título: A
Bayesian solution to an inverse
problem in groundwater contamination modeling.
Resumo
In this work we use Bayesian methods to solve a parameter estimation
(inverse) problem in groundwater contamination. The problem consisted
of estimating the values of water velocity and dispersion parameters of
an analytical solution to an advection-dispersion differential
equation. Following standard practice in this field, this equation was
assumed to provide a good mathematical description of the groundwater
system relevant to our work. The experimental data were obtained by a
tracer experiment which consisted in a two-well recirculation tracing
test, and was performed using an extraction-injection well couplet.
Previous work in this field has largely been confined to the use of
maximum-likelihood techniques, which depend upon large-sample
approximations to provide measures of uncertainty for parameter
estimates. We pose the inverse problem in a
Bayesian framework: we use diffuse prior distributions and the values
of
observed tracer concentrations versus time to obtain posterior
distributions
for the parameters of interest, employing Markov chain Monte Carlo
simulation
techniques to explore the posterior distributions for the parameters.
Our
principal finding is that, even with appropriate uncertainty bands on
all
of the relevant parameters, the standard advection-dispersion
differential
equation used in this field to model groundwater systems like the one
we
studied is inadequate to fit the observed data. This work demonstrates
that
Bayesian methods can produce highly informative results in the field of
groundwater
contamination modeling.
Palestrante:
Tufi Machado Soares
Título:
Aplicações de MCMC na
estimação de
modelos para a análise do comportamento diferencial do item.
Resumo
Será apresentado um resumo dos
principais métodos para estimação dos
parâmetros dos modelos da teoria
da Resposta ao item. Em seguida, será introduzido
o problema do comportamento
diferencial do Item e serão apresentados sucintamente os
principais métodos
de detecção. Finalmente,
propõe-se modelos hierárquicos para a
detcção e, ou, a
confirmação do comportamento
diferencial apresentado por um
mesmo conjunto de itens associados a um mesmo tema.
Indicam-se abordagens
possíveis, baseadas em MCMC, para a
estimação desses modelos.
Palestrante:
Carlos Alberto de Bragança Pereira
Título:
Significância Bayesiana
Resumo
(Resumo extraído do Relatório Técnico
IME-USP MAE 05/15 Pereira, Stern
e Weshler (2005) "Can a significance test be genuinely Bayesian?" )
This paper reviews of the Full Bayesian Significance Test, FBST. The
original and the invariant versions of the FBST evidence values are
discussed in detail and compared with alternative procedures:
Neyman-Pearson-Wald based
p-values and Bayes factor based posterior probabilities. Three standard
statistical problems, independence in contingency tables,
Behrens-Fisher, and variable selection in linear egression, are used to
illustrate the FBST advantages and versatility.
Palestrante:
Oswaldo G. Cruz
Título:
Modelagem
Espaço-Temporal dos
homicídios região Sudeste/Brasil, 1979-1998.
Resumo
Neste trabalho analisamos aspectos temporais, espaciais e
espaço-temporais dos homicídios ocorridos nos
municípios da Região Sudeste do Brasil,
nos anos de 1979 a 1998. Diversos tipos de técnicas foram
utilizadas, tais
como modelos de series temporais, analise espacial, e analise
exploratória
espaço temporais utilizando animação
de mapas e superficies. Também foram
utilizados modelos GAMM bayesianos com extensão
espaço temporais. O emprego
dessas múltiplas técnicas permitiu
observar a tendência crescente dos
homicídios na região sudeste e seu espalhamento
ao longo do período estudado. Os modelos também
evidenciaram mais de um tipo de processo espaciais e
temporais ocorrendo nos estados da Região Sudeste.
Palestrante:
Friedli Sacha
Título:
Truncamento em Sistemas com Interações
não-somáveis.
Resumo
A existência de transicoes de fases eh bem definida,
no padrao da
mecanica estatistica, para sistemas cujas interacoes sao
SOMÁVEIS. Para
tais sistemas, a ocorrencia de transicoes de fases depende fortemente
da temperatura. Quando as interações
são não- somáveis, essa
dependência
é trivial, e nós vamos mostrar que o
sistema sempre pode ser truncado.
Isto é, consideremos um modelo ferromagnetico onde
todas as interações entre partículas
afastadas de mais de N unidades são desprezadas.
Para
qualquer temperatura T, acontece o seguinte: quando N vai
para o infinito,
as medidas de Gibbs do sistema em equilíbrio (de
temperatura T) convergem
fracamente para as medidas de Dirac associadas aos estados
fundamentais
do sistema. Quer dizer: o modelo truncado sempre tem
transição de fase
quando N eh grande o suficiente. Esse resultado, cuja prova
usa metodos
de percolacao, mostra que sistemas de longo alcance
nao-somaveis tem comportamento termodinamico trivial.
Palestrante:
Josemar Rodrigues - UFSCar
Título:
Bayesian
Inference: A journey beyond normality, dependence and precise hypotheses
Resumo
Lately, there has been an increasing interest in finding more flexible
and realistic models and evidence measures to represent adequately as
possible the features of the data. In this conference we review recent
developments in Bayesian Inference based on skew-normal distributions,
entropy for modelling dependent variables and evidence test for precise
hypotheses. The skew-normal distribution ,which includes the
uni-variate
normal distribution as a special case , can be exploited in Bayesian
analysis
both for modelling prior beliefs and asymmetric observations. The book
recently edited by Genton (2004) shows a collection of applications in
different areas. In this conference, a new extended skew-measurement
error
model is introduced with application on real data via Winbugs. Some
basic
concepts of the Maxent theory are presented in order to characterize
the
association among variables observed in the same individual (called
"frailty
entropy") and an application on real recorrent data is also considered.
Finally, the conference is ended by introducing a "fully " Bayesian
method
for precise hypotheses (Pereira and Stern, 1999) to compute the
evidence
of the Poisson distribution against the Zero-In‡ated Poisson
distribution
(ZIP). This measure is intuitive and easy to implement via Winbugs as
an alternative to the classical p-value tests.
Palestrante:
Clarice Demétrio - ESALQ-USP
Título: An
Overview of Overdispersion
Resumo
This talk will provide a treatment of overdispersion in generalized
linear models, present a survey of the commonly used models, discuss
general ideas of estimation and inference and consider the practical
application of the methods in applied statistics. Applications will be
drawn from biometry, biostatistics and social science.
Palestrante:
Marc Suchard - UCLA, EUA
Título:
Statistical solutions to fundamental difficulties in evolutionary
reconstruction models
Resumo
Genomics research is
generating vast molecular sequence data ranging from single genes to
whole genomes across an increasing number of species. However,
fundamental difficulty in evolutionary studies emerges as the
availability of sequences expands. Phylogenetics methods to
reconstruct the evolutionary tree relating the sequences traditionally
condition on a single, sometimes poorly estimated sequence alignment,
where an alignment specifies which residues in the sequences derive
from a common origin. This conditioning can cause bias and
inappropriate infer in genomic studies, particularly when the sequences
are highly diverse. For example, the early branching-order of Bacteria,
Archaea and Eukaryotes, the three major domains of life, is troublesome
to determine. As a solution, I describe a novel Bayesian model for
simultaneously estimating alignments and the phylogenetic trees that
relate the sequences. This sidesteps the bias issue inherent in
sequential estimation. Joint estimation also allows one to model rate
variation between sites when estimating the alignment and to use the
evidence in shared insertion/deletions (indels) in the sequences to
group sister species in the tree. I base this indel process on a Hidden
Markov Model that makes use of affine gap penalties and considers
indels of multiple residues. I develop a Markov chain Monte Carlo
(MCMC) method to sample from the posterior of the joint model,
estimating the most probable alignment and tree and their support
simultaneously. I describe a new MCMC transition kernel based on the
Forward-Backward algorithm and a careful choice of parameter
marginalization that improves our algorithm's mixing efficiency,
allowing the MCMC chains to converge even when started from arbitrary
alignments. Finally, my software implementation can estimate alignment
uncertainty and I describe a method for summarizing this uncertainty in
a single plot.
Palestrante:
Hedibert Freitas Lopes - GSB, University of Chicago
Título:
Time-varying variances through copulas
Resumo
It is well known that financial volatilities move frequently together
through
time and
then, it is important to find appropriate models to understand and
predict the temporal
dependence in multivariate high-frequency data. Although
widely used, the correlation
matrix is not a well measure of dependence when normality assumptions
do not hold and
it can be misleading for financial investors.
Copula is one of the most promising tools to describe the dependence
between random
variables. The main idea behind copula is to separate the marginal
behaviour and
dependence structure from joint distribution.
Previous works using copulas in dynamic
models does not account for the parameter uncertainty simultaneously.
Proposed methods
use 2-steps ML approaches which lead to consistent but not efficient
estimators.
We propose a Bayesian fully analysis that simultaneously access
posterior uncertainty
for the parameters of the marginals and the parameters of the
dependence structure
defined by a copula function.
2º semestre de 2004
As palestras são realizadas na sala C116 do Centro
Tecnológico as 15:30 hs, a menos que ocorra aviso em
contrário
- 01/12
Friedli Sacha - IMPA-RJ (Resumo)
Título:
Truncamento em percolação de longo
alcance.
- 17/11
Marcelo Viana - IMPA-RJ
Título: Estabilidade
estocástica de sistemas dinâmicos. (Resumo)
- 03/11 (Excepcionalmente às 15h)
Caio Ibsen Rodrigues de Almeida - IBMEC-RJ
Título:
Affine Processes, Arbitrage-Free Term Structures of Legendre
Polynomials and Option Pricing. (Resumo)
- 20/10 Fernando Moura
- DME-UFRJ
Título:
Small Area Estimation Under Different Boundary Systems via
Low Level Modelling (Resumo)
- 06/10 (Excepcionalmente às 15h)
Defesa da Primeira Tese de Doutorado do Programa de
Pós-Graduação do DME-UFRJ
- Marina Paez -
DME-UFRJ
Título:
Análise de modelos para a
estimação e previsão de processos
espaço-temporais (Resumo)
- 24/09 (Excepcionalmente
6ª feira as 15h) Petar M. Djuric - Stony Brook
University NY, USA
Título:
New developments in the theory and practice of particle filtering (Resumo)
- 08/09 Luiz Renato Lima
- FGV-RJ
Título: Testing
Unit Root Based on Partially Adaptive Estimation. (Resumo)
- 25/08 Cristiane Duarte
- DME-UFRJ
Título:
Uma Análise Bayesiana para Dados Educacionais (Resumo)
- 18/08 Hedibert Freitas
Lopes - GSB-University of Chicago / DME-UFRJ
Título:
Bayesian Factor Models in Financial Econometrics (Resumo)
1º semestre de 2004
As palestras são realizadas
na
sala C116 do Centro Tecnológico as 15:30 hs, a menos que
ocorra aviso em contrário
- 30/06 Heleno
Bolfarine - IME-USP
Título:
Modelos assimétricos normais para modelos com
variáveis latentes (Resumo)
- 23/06 Paulo
Justiniano - UFPR
Título:
Avaliando a evolução da Morte Súbita
dos Citrus (Resumo)
- 09/06 João
Victor Issler - FGV - RJ
Título: Using
Common Features to Construct a Preference-Free Estimator of the
Stochastic Discount Factor (Resumo)
- Download do paper
- CANCELADA - 04/06 (Sexta Feira)
- Byron Morgan, Institute of Mathematics and Statistics,University of
Kent, Canterbury.
Título:
Models for yeast prions (Resumo)
- 19/05 - Jorge P.
Zubelli - IMPA
Título: O
Impacto da Matemática em Biociências (e
Vice-Versa): Exemplos e Desafios em Tomografia e Microscopia
Eletrônica Tri-Dimensional. (Resumo)
- 12/05 -
Márcia D´Elia Branco e Cristian Luis Bayes
Rodriguez - IME-USP
Título:
Problemas de Inferência na distribuição
normal assimétrica. (Resumo)
- 28/04 - Jorge
Washington Silva Bhering -
Título:
Simulação Estocástica Aplicada em
Plano de Contribuição Definida. (Resumo)
- CANCELADA - 14/04 -
Francisco Louzada-Neto, Departamento de Estatística - UFSCar
Título: Bayesian
Estimation of the Disease Prevalence and Performance Measures of
Diagnostic tests in the Presence of Latent Gold Standard.(Resumo)
- 31/03 - Edgar
Acuña , Department of Mathematics, University of Puerto Rico
Título:
Feature selection methods in supervised classification.(Resumo)
- 24/03 - Cibele Queiroz
da Silva, Departamento de Estatistica - ICEx - UFMG
Título:
Modelos Markovianos com Estados latentes aplicados a uma
subsequência do genoma da Xylella fastidiosa.(Resumo)
- 12/02 (as 10:30) - Jim
Zidek, University of British Columbia
Título:
Uncertainty and Information. (Resumo)
Resumos
das Palestras
Palestrante:
Friedli Sacha - IMPA-RJ
Título: Truncamento
em percolação de longo alcance.
Resumo
O fenômeno de percolação é a
presença quase certa, em grafos
aleatórios, de aglomerados de tamanho infinito. Em geral,
nós estudamos
grafos aleatórios cujos pontos são pontos do
plano com coordenadas inteiras,
e onde existe uma conexão entre dois pontos com uma certa
probabilidade
(dependendo da distância). Pontos são conectados
entre si de modo independente. Dizemos que o sistema percola quando
existe, em tal grafo aleátorio, um aglomerado de tamanho
infinito.
O problema do truncamento é o seguinte. Suponhamos que o
sistema percola. Será que existe um numero N (grande) tal
que o novo
grafo obtido, apagando todos as conexões de tamanho maior do
que N, ainda percola?
Palestrante:
Marcelo Vianna - IMPA-RJ
Título: Estabilidade
estocástica de
sistemas dinâmicos
Resumo
Dizemos que um sistema dinâmico é
estável se o seu comportamento permanece "essencialmente o
mesmo" quando a lei de
evolução é ligeiramente modificada.
Em aplicacoes práticas é fundamental saber que o
modelo utilizado é de fato estável, porque se
trata sempre de uma aproximação do sistema real.
Para tornar a idéia de estabilidade uma
definição matemática, precisamos
explicar o que entendemos por "essencialmente
o mesmo". O ponto de vista estocástico, devido a
Kolmogorov, propõe focalizar dados de tipo
estatístico, tais como as médias temporais
de grandezas observáveis, e analisar como esses dados
são afetados quando
o sistema é sujeito a pequeno ruído
aleatório. Falamos de estabilidade estocástica se
as médias temporais correspondentes ao sistema com
ruído estão próximas daquelas que
correspondem ao sistema inicial não perturbado.
As demonstrações rigorosas de estabilidade
estocástica são quase sempre
difíceis, e a teoria permanece bastante incompleta. Mas tem
havido um bom número de resultados recentes nesta
área e começa a desenhar-se a perspectiva de que
grandes classes de sistemas dinâmicos são
estáveis.
Palestrante:
Caio Ibsen Rodrigues de Almeida - IBMEC-RJ
Título: Affine
Processes, Arbitrage-Free Term Structures of Legendre Polynomials and
Option Pricing.
Resumo
Modelos Afins multi-variados para a estrutura a termo da
taxa de juros tem sido utilizados com grande frequência no
apreçamento de derivativos de renda fixa. Nestes modelos, a
incerteza é gerada por um vetor de espaço de
estados, sendo a taxa de juros de curto prazo uma
função afim de tal vetor. O modelo é
caracterizado por
uma forma específica de Equação
Diferencial Estocástica (EDE) para a
evolução do vetor de estados, que impoe
restrições de não-arbitragem sobre tal
modelo. Neste paper resolvemos o seguinte problema inverso:
Suponha que a estrutura a termo da taxa de juros é modelada
por uma combinação
linear de Polinômios de Legendre com coeficientes
estocásticos. Pergunta:
Existe então uma EDE para estes coeficientes que garanta
ausência de
arbitragem no mercado? Do ponto de vista prático, obtemos
tais EDEs sob
diferentes circusntâncias e apresentamos alguns exemplos de
apreçamento de opções, e outros ativos
de renda (DIs do mercado brasileiro).
Palestrante:
Fernando Moura - DME-UFRJ
Título: Small Area
Estimation Under Different Boundary Systems via Low Level Modelling
Resumo
The main objective is to develop a model based estimation
methodology that is sufficiently flexible to accommodate a
variety of boundary systems. The strategy considered here is
to model the data at a very low geographical level and build
the estimation at any
desired level by aggregation. We develop a methodology for estimating
at varying and not necessary compatible boundary systems and
obtain precision measures for any desired boundary system that
can be obtained by low level aggregation. In order to
investigate the adequacy of the
proposed methodology, we show and discuss the results of a
small simulation study.
Palestrante: Marina
Paez - DME-UFRJ
Título:
Análise
de modelos para a estimação e previsão
de processos espaço-temporais
Resumo
Nesse trabalho analisamos observações feitas no
espaço e/ou tempo que apresentam estrutura de
correlação nessas dimensões, usando
para isso modelos que levam em consideração essa
dependência, e tendo como objetivo fazer previsões
para tempos futuros e interpolação espacial. Para
tratar a variação espaço-temporal,
propomos modelos
hierárquicos que incorporam uma estrutura de
correlação temporal e ou espacial na
média (condicional aos processos explicativos) da
variável
resposta, e nos casos onde existe considerável
heterogeneidade espacial
no efeito de processos explicativos, incorporam também uma
estrutura de
correlação no tempo/espaço nos
coeficientes relativos a esses processos.
Tendo como base os modelos dinâmicos (para tratar
variação temporal) e os
campos aleatórios gaussianos (para tratar
variação espacial), e trabalhando
sob o ponto de vista Bayesiano, propomos três diferentes
modelagens para
dados temporais ou espaço-temporais. A primeira proposta
é uma extensão
dos modelos usados em Paez e Gamerman (2003), onde permitimos que os
coeficientes
das covariáveis variem no espaço, e estudamos os
efeitos da incorporação
de incertezas no modelo. A segunda proposta é uma
generalização da primeira, onde os
parâmetros associados às variáveis
resposta variam no tempo e no
espaço. Essa modelagem é um caso particular dos
modelos dinâmicos hierárquicos
matriz-variados propostos por Landim e Gamerman (2000) para respostas
gaussianas
multivariadas, onde impomos uma forma estruturada para as matrizes de
variância
espacial. A terceira e última proposta é um
estudo da variação temporal
da incidência de eventos através de processos de
Cox log-gaussianos,
baseado no artigo de Brix e Diggle (2001).
Palestrante:
Petar M. Djuric - Stony Brook University NY, USA
Título: New
developments in
the theory and practice of particle filtering.
Resumo
In the past decade, particle filtering has attracted much attention of
engineers and scientists. It is used in problems where observed data
are described by state-space models that contain nonlinear equations
and where the noise is possibly non-Gaussian. Particle filtering is
based on random grids whose nodes are called particles and where the
nodes have weights that account for their importance. The particles and
the weights form random measures, which approximate the distributions
of the unknowns. In this presentation, first some of the basics of
particle filtering will be provided followed by a description of some
new developments and challenges in its theory and practice. Examples
will include use of particle filters for tracking in wireless sensor
networks.
Palestrante: Luiz
Renato Lima - FGV-RJ
Título: Testing Unit
Root
Based on Partially Adaptive Estimation.
Resumo
This paper proposes unit root tests based on partially adaptive
estimation. The proposed tests provide an intermediate class of
inference procedures that are more efficient than the traditional
OLS-based methods and simpler than unit root tests based on fully
adaptive estimation using nonparametric methods. The limiting
distribution of the proposed test is a combination of standard normal
and the traditional Dickey-Fuller (DF) distribution, including the
traditional ADF test as a special case when using Gaussian density.
Taking into account the well documented characteristic of heavy-tail
behavior in economic and financial data, we consider unit root tests
coupled with a class of partially adaptive M-estimators based on the
student-$t$ distributions, which
includes the normal distribution as a limiting case. Monte Carlo
Experiments indicate that, in the presence of heavy tail distributions
or innovations that are contaminated by outliers, the proposed test is
more powerful
than the traditional ADF test. We apply the proposed test to several
macroeconomic time series that have heavy-tailed distributions. The
unit
root hypothesis is rejected in U.S. real GNP, supporting the literature
of transitory shocks in output. However, evidence against unit root is
not found in real exchange rate and nominal interest rate even when
haevy-tail is taken into account.
Palestrante:
Cristiane Duarte - DME-UFRJ
Título: Uma
Análise Bayesiana para Dados Educacionais
Resumo
Apresentamos uma análise Bayesiana a respeito da performance
de alunos do ensino fundamental da rede municipal do Rio de Janeiro em
uma prova de matemática tendo como
referência suas características pessoais, a
formação do professor, efeitos da turma
e da escola, e tipo de questões que compõem a
prova. O nosso objetivo é identificar as dificuldades de
aprendizado inerentes ao aluno e
quantificar os efeitos positivos e negativos que podem
impactar na qualidade
do ensino. São aplicados modelos Bayesianos incluindo
efeitos espaciais e efeitos específicos referentes ao
nível de dificuldade das questões
da prova de matemática. No modelo são
incluídas ao nível do aluno variáveis
específicas deste, ao nível da turma
variáveis específicas do professor
e ao nível da escola efeitos espaciais para captar a
influência de
variáveis sócio-econômicas
não disponíveis diretamente. Incluindo
estes efeitos espaciais, assumimos implicitamente que escolas
geograficamente próximas tem variáveis
sócio-econômicas similares. Os resultados desta
análise podem ser utilizados na
definição de estratégias e
políticas educacionais, visando em última
instância a melhoria do
ensino-aprendizagem da Matemática. Com esta
análise Bayesiana podemos
inferir quais variáveis específicas impactam mais
na performance dos
alunos, além de obter um mapa dos efeitos espaciais e assim
definir
as regiões do município que devem receber mais
atenção na melhoria do ensino da
matemática.
Palestrante:
Hedibert F. Lopes - GSB-University of Chicago / DME-UFRJ
Título:
Bayesian
Factor Models in Financial Econometrics
Resumo
We review in depth and breadth the use of factor analysis in
structuring covariances in multivariate financial time series
models. In the first part of the talk, we introduce the
traditional static factor model and discuss parametrization and
identification issues as well as frequentist and Bayesian inference
when the number
of factors is kept fixed. We then present Lopes and West's
(2004) Reversible Jump MCMC that deals with uncertainty associated to
the number of factors and Lopes's (2003) study on prior
robustness. Time-varying covariance models are reviewed in
the second part of the talk, when factor stochastic volatility and
factor-ARCH like models are extensively discussed and
compared. Lopes and Migon's
(2002) study on financial contagion in Latin America is
discussed. The talk finishes with the introduction of a new
class of time-varying covariance models: The Time-Varying Cholesky
Decomposition Model of McCullogh, Lopes and Tsay (2004). The
previous models are compared to the our new model in a trivariate
financial time series applications comprising the North American, the
Brazilian and
the Mexican market indexes.
Palestrante:
Heleno Bolfarine - IME-USP
Título:
Modelos
assimétricos normais para modelos com variáveis
latentes
Resumo
Consideramos expressões
analíticas para as funções de
verossimilhanças no modelo linear com erros nas
variáveis e no modelo com efeitos
aleatórios. Dada a complexidade da
função de verossimilhança consideramos
um algoritimo do tipo EM para a estimaçao dos
parâmetros do modelo.
Palestrante:
Paulo Justiniano
- UFPR
Título:
Avaliando a
evolução da Morte Súbita dos Citrus
Resumo
A Morte Súbita dos Citrus
(MSC)
é uma doença qua atinge certas
combinações de enxerto/porta-enxerto em
árvores de citrus já afetando
parte da principal região citrícola brasileira e
com potencial de
espalhamento nos próximos anos. A doença foi
detectada pela primeira vez em 1999 e descrita em 2001. O agente
causador ainda não está determinado
embora evidências apontem para uma
variação do vírus da Tristeza dos
Citrus.
Dada a situação atual de alto risco e potencial
prejuízo a doença tem sido foco de
atenção por porte dos orgãos ligados a
produção de citrus. Diversos levantamentos de
dados e estudos tem sido realizados a fim de compreender melhor os
padrões de dispersão espacial da
doença tanto a pequena escala em talhões, quanto
na larga escala, na região produtora.
Nesta apresentação descreve-se o problema e
as questões de relevância científica e
estatística associadas. Resultados obtidos até o
momento serão apresentados e serão discutidas
estratégias para futuras análises.
Palestrante:
João Victor Issler - FGV-RJ
Título: Using
Common Features to Construct a Preference-Free Estimator of the
Stochastic Discount Factor
Resumo
We propose a novel estimator for the
stochastic discount factor (SDF) in a panel-data context. Under general
conditions it depends
exclusively on appropriate averages of asset returns, and its
computation is a direct exercise, as long as one has enough
observations
to fit our asymptotic results. We identify the SDF using the fact
that it is the "common feature" in every asset return of the economy.
Moreover, it does not depend on any assumptions about preferences,
or on consumption data, which allows testing directly different
preference
specifications, as well as the existence of the equity-premium puzzle.
Preliminary results are encouraging.
Palestrante:
Byron Morgan, Institute of Mathematics and Statistics,University of
Kent, Canterbury.
Título:
Models for
yeast prions.
Resumo
In this talk I shall describe current joint research with Martin Ridout
and Diana Price (Statistics, Kent), Mick Tuite and Lee Byrne
(Biosciences Kent) and Lloyd Ruddock (Biosciences, Finland).
We are motivated by experiments at Kent, designed to estimate the
mean number, m, of prions in yeast cells. The work has important
consequences for understanding both prion behaviour and the basic
mechanisms taking place within living cells. The seminar assumes no
previous knowledge of the biological setting, and the essence of the
seminar involves elementary probability theory and model-fitting. The
yeast protein Sup35p exists in two stable forms, giving rise to
phenotypes [PSI+] and [psi-], distinguished by a colour assay. Because
it replicates in a manner similar to the mammalian prion PrP, Sup35p is
called a yeast prion. When the chemical GuHCl is added to a culture
medium growing [PSI+] cells, the proportion of [PSI+] cells gradually
decreases over time, because of inhibition of prion replication: the
number of prions present initially is gradually diluted through an
expanding population of yeast cells. The experimental data provide
estimates of the proportion of [PSI+] cells at
hourly intervals. We develop stochastic models for this process, and
obtain
an interesting analytical solution when cell doubling time is assumed
to
be constant, but not synchronised between cells. We then use a more
realistic
model that allows for variation in doubling time. Our estimate of m ~
100
is substantially larger than a previously published estimate. Other
parameters
in the model include the mean, n, of cell doubling time and a time lag
parameter
that allows for disruption to cell doubling at the start of the
experiment.
Our estimates of n agree closely with independent estimates from
optical
density (OD) measurements. OD data are also used to distinguish between
alternative estimates of the time lag that give almost equivalent fits
to the data. Model extensions which incorporate greater biological
realism,
will also be described.
Palestrante:
Jorge P. Zubelli - IMPA
Título: O
Impacto
da Matemática em Biociências (e Vice-Versa):
Exemplos e Desafios em Tomografia e Microscopia Eletrônica
Tri-Dimensional.
Resumo
Nas últimas
décadas a
tomografia computadorizada tem permitido avanços
surpreendentes em diversas áreas de medicina. Do ponto de
vista de desenvolvimento científico isso se deve a um
tremendo esforço de integração
interdisciplinar. Nesta palestra pretendo
inicialmente fazer um breve apanhado das ferramentas
matemáticas que permitiram a tomografia se tornar uma
realidade, bem como alguns
dos problemas matemáticos suscitados pela mesma. A seguir
discutirei algums dos desafios matemáticos encontrados pelo
imageamento de
tecidos com infra-vermelho e pela microscopia eletrônica
tri-dimensional de macro-moléculas.
Palestrante:
Márcia D´Elia Branco e Cristian Luis Bayes
Rodriguez - IME-USP
Título:
Problemas
de Inferência na distribuição normal
assimétrica.
Resumo
No presente trabalho discutimos o
problema
da estimação via
máxima verossimilhança para o parâmetro
de assimetria da distribuição
normal assimétrica univariada (Azzalini, 1985) e
apresentamos alternativas Bayesianas bastante eficientes para
estimação desse parâmetro. Uma
aplicação em modelos de regressão
linear com erros nas variáveis será discutida,
enfatizando a estrutura hierárquica do modelo.
Palestrante:
Jorge Washington
Silva Bhering -
Título:
Simulação Estocástica Aplicada em
Plano de Contribuição Definida.
Resumo
Planos de
Contribuição
Definida geram benefícios de aposentadoria, em regime
individual, que dependem do montante obtido na
aplicação
das contribuições vertidas por seus
participantes. A técnica usualmente
adotada para a projeção das rendas de
aposentadoria consiste na
aplicação de modelos determinísticos.
Após a concessão do benefício, a
responsabilidade das entidades é dimensionada exclusivamente
em função do valor esperado do fluxo de
pagamentos. Como alternativa propõe-se a
aplicação de modelos estocásticos no
contexto de planos
de contribuição definida em duas etapas: a)
acumulação de recursos;
e b) pagamento de benefícios. Na primeira etapa é
apresentado um modelo
de acumulação estocástico, orientado
por uma política de macro alocação
atrelada à meta sob o princípio de otimalidade de
Bellman. Na
segunda, a distribuição dos compromissos da
entidade é simulada a
partir da distribuição dos compromissos
individuais de cada um de seus participantes que estejam em gozo de
benefício de renda de aposentadoria.
Palestrante:Francisco
Louzada-Neto, Departamento de Estatística - UFSCar
Título:Bayesian
Estimation of the Disease Prevalence and Performance Measures of
Diagnostic tests in the Presence of Latent Gold Standard.
Resumo
In this seminar we present a Bayesian
analysis for estimating the disease prevalence, the sensitivity and
specificity of several independent diagnostic tests in the presence of
a covariate and latent gold standard. We use Metropolis-Hastings
algorithm to obtain the posterior summaries of interest. The
methodology can be easily extended
to the case with two or more covariates or more than two tests.
With only two diagnostic tests we can not perform a maximum likelihood
procedure since the number of unknown parameters is bigger than the
number of observations. Under the Bayesian approach we overcome this
problem by introducing latent variables. An application to a real
medical
data illustrates the methodology.
Palestrante:
Edgar Acuña, Department of Mathematics, University of Puerto
Rico
Título:Feature
selection methods in supervised classification
Resumo
In this talk we will present an
empirical
comparison of filter and
wrapper procedures for supervised classification. The filter methods
considered are: Relief, Las Vegas Filter (LVF), and FINCO, a new method
introduced by us. Among the wrappers considered are: The sequential
forward selection (SFS) and the sequential floating forward selection
(SFFS). The classifiers used by the wrappers are: The linear
discriminant analysis (LDA), The k-nearest neighbors (KNN) classifier
and a decision tree classifier based on recursive partition (Rpart).
Both type of feature selection procedures are compared on the
percentage
of selected features as well as on their effect on the
misclassification rate of the classifiers. Finally, we compare our
results with feature selection using Random Forest. The experiments are
carried out in
twelve datasets coming from the Machine Learning Database Repository
available at the University of California, Irvine.
Palestrante:
Cibele Queiroz da Silva, Departamento de Estatística - UFMG
Título:Hidden
Markov models applied to a subsequence of the Xylella fastidiosa genome
Resumo
Dependencies in DNA sequences are frequently modeled using Markov
models. However, Markov chains cannot account for heterogeneity that
may be present in different regions of the same DNA sequence. Hidden
Markov models are more realistic than Markov models since they allow
for the identification of heterogeneous regions of a DNA sequence. In
this work we present an application of hidden Markov models to
a subsequence of the Xylella fastidiosa DNA data. We found that a
three-state model provides a good description for the data considered.
Palestrante:
Jim Zidek, University of British Columbia
Título:Uncertainty
and Information
Resumo
"Uncertainty", like its complementary
cousin, "information", is a much used but not very well defined concept
despite its intrinsic role in statistics. (Indeed, that latter is often
described as
the "science of uncertainty".) In this talk, I will explore some of the
meanings provided in a paper, written with Constance van Eeden, that
are ascribed to that
term and readily discover that seemingly natural questions can
have answers that are either elusive or counter-intuitive. For
example, surprisingly (in answer to one of those questions), the
level of uncertainty (according to one defintion) can actually
increase rather than decrease as the amount of information increases.
For other definitions we have not been able to give general answers to
that question. I will also address the issue of combining information
to reduce uncertainty. Specifically, I will survey some recent work I
have done with Constance van Eeden and others on the use of the
weighted likelihood in conjunction with samples from populations
different
from, but similar to that under study. That resemblence can lead
to very effective trade-offs of bias for precision when it derives
from structural relations among the various population parameters,
for example, when the difference in the population means may be
bounded by a fixed constant.
|