Javascript DHTML Drop Down Menu Powered by dhtml-menu-builder.com


 

 

 

 

 

 

 



Palestras do Departamento de Metodos Estatísticos
Instituto de Matemática - UFRJ

Palestras dos anos anteriores e respectivos resumos


2º semestre de 2013
As palestras são realizadas no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos que ocorra aviso em contrário.


  • 18/12  Sergio López (UFRJ)
    Título:  Quantitative requeriments in Solvency II Directive: a concrete example (Resumo)
  • 18/12 Colóquio Institucional (excepcionalmente as 13:30 horas)  
    • Thiago G. Martins (NTNU, Noruega)
      Sensitivity analysis for Bayesian hierarchical models (Resumo)
    • Rodrigo S. Targino (UCL, Inglaterra)
      Optimal insurance purchase strategies via optimal multiple stopping times (Resumo)
  • 04/12  Dipankar Bandyopadhyay (Minnesota)
    Título:  A nonparametric spatial model for periodontal data with non-random missingness (Resumo)
  • 13/11  Flávio Ávila (UERJ)
    Título:  Recuperando gravações de áudio através da Estatística (Resumo)
  • 06/11 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas no CBPF)  
    • Marcio Argollo de Menezes (UFF)
      O que limita o crescimento celular? Uma abordagem sistêmica (Resumo)
    • Sidarta Ribeiro (UFRN)
      Sonho, Memória e Loucura (Resumo)
  • 23/10  Miguel Abadi (USP)
    Título:  Statistical properties for the occurrence times of rare events: an overview (Resumo)
  • 02/10 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas no IME-UFF)  
    • Jean Pierre Gazeau (Université Paris Diderot)
      Integral quantization: Weyl-Heisenberg versus affine group (Resumo)
    • Yuri Suhov (Cambridge/USP)
      Stochastic Aspects of Quantum Theory (Resumo)
  • 18/09  Glaura C. Franco (UFMG)
    Título:  Observation driven time series models (Resumo)
  • 11/09  Josemar Rodrigues (UFSCar)
    Título:  Modeling lifetimes by a stochastic process hitting a critical point (Resumo)
  • 04/09 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas no Auditório Ricardo Mañé do IMPA)  
    • Marcia C. Barbosa (UFRGS)
      Água: um líquido complexo (Resumo)
    • Artur Ávila (IMPA)
      Produtos aleatórios de matrizes e dinâmica de bilhares racionais (Resumo)
  • 16/08  Juan Carlos Pardo Fernández (Vigo) (excepcionalmente numa 6a feira as 13:30 horas)
    Título:  Nonparametric estimation of ROC curves and associated summary indices with covariates (Resumo)
  • 24/07  Thomas Mountford (Lausanne) (excepcionalmente na sala C116)
    Título:  Stability for Poisson rain models (Resumo)


Resumos das palestras do 2º semestre de 2013

 Palestrante :  Sergio López
Título:   
Quantitative requeriments in Solvency II Directive: a concrete example
Resumo
During the financial worldwide crisis in 2008 some insurance companies experienced solvency problems. A famous case was featured by the American International Group (AIG), the world's biggest insurance company for many decades. The United States government decided to spend 85 billion dollars to bailout AIG.
In 2009 the European Union approved Solvency II Directive (S2D), a regulation scheme aiming to reduce companies' risk of insolvency and to promote consumer protection. The regulation to be implemented in 2016, regards the amount of capital insurance companies most hold in order to be solvent. Since the approval of S2D, other non-European countries have followed the initiative to renew their own regulation laws in the same spirit. 
S2D is based on three main pillars: quantitative requirements (e.g. the amount of capital an insurer should hold), qualitative requeriments concerning the risk management of insurers as well as its supervision (e.g. an internal risk board and its evaluation) and disclosure and transparency requirements. 
The objective of this talk is to address the quantitative requirements of the Mexican law regulation (to be applied on 2014) through the study of a particular type of insurance: the short period life. This new methodology includes Actuarial science, Statistics and Stochastic processes topics. If time allows we will give a glimpse of more complex insurance examples.

 Palestrante :  Thiago G. Martins
Título:   
Sensitivity analysis for Bayesian hierarchical models
Resumo
Prior sensitivity analysis plays an important role in Bayesian statistics. This is especially true for Bayesian hierarchical models, where interpretability of the parameters within deeper layers in the hierarchy becomes challenging. In addition, lack of information together with identifiability issues may imply that the prior distributions for such models have an undesired influence on the posterior inference. Despite its relevance, informal approaches to prior sensitivity analysis are currently used. They require repetitive re-runs of the model with ad-hoc modified base prior parameter values. Other formal approaches to prior sensitivity analysis suffer from a lack of popularity in practice, mainly due to their high computational cost and absence of software implementation. We propose a novel formal approach to prior sensitivity analysis which is fast and accurate. It quantifies sensitivity without the need for a model re-run. We develope a ready-to-use priorSens package in R for routine prior sensitivity investigation by R-INLA. Throughout a series of examples we show how our approach can be used to detect high prior sensitivities of some parameters as well as identifiability issues in possibly over-parametrized Bayesian hierarchical models.
Joint work with Malgorzata Roos, Leonhard Held & Havard Rue.

 Palestrante :  Rodrigo S. Targino
Título:   
Optimal insurance purchase strategies via optimal multiple stopping times
Resumo
In this talk we study a class of insurance products where the policy holder has the option to insure k of its annual Operational Risk losses in a horizon of T years. This involves a choice of k out of T years in which to apply the insurance policy coverage by making claims against losses in the given year. The insurance product structure presented can accommodate any kind of annual mitigation, but we present three basic generic insurance policy structures that can be combined to create more complex types of coverage. Following the Loss Distributional Approach (LDA) with Poisson distributed annual loss frequencies and Inverse-Gaussian loss severities we are able to characterize in closed form analytical expressions for the multiple optimal decision strategy that minimizes the expected Operational Risk loss over the next T years.
Joint work with Gareth Peters, Georgy Sofronov & Pavel Shevchenko.

 Palestrante :  Dipankar Bandyopadhyay
Título:   
A nonparametric spatial model for periodontal data with non-random missingness
Resumo
Periodontal disease progression is often quantified by clinical attachment level (CAL) defined as the distance down a tooth's root that is detached from the surrounding bone. Measured at 6 locations per tooth throughout the mouth (excluding the molars), it gives rise to a dependent data set-up. These data are often reduced to a one-number summary, such as the whole mouth average or the number of observations greater than a threshold, to be used as the response in a regression to identify important covariates related to the current state of a subject's periodontal health. Rather than a simple one-number summary, we set forward to analyze all available CAL data for each subject, exploiting the presence of spatial dependence, non-stationarity, and non-normality. Also, many subjects have a considerable proportion of missing teeth which cannot be considered missing at random because periodontal disease is the leading cause of adult tooth loss. Under a Bayesian paradigm, we propose a nonparametric flexible spatial (joint) model of observed CAL and the location of missing tooth via kernel convolution methods, incorporating the aforementioned features of CAL data under a unified framework. Application of this methodology to a data set recording the periodontal health of an African-American population, as well as simulation studies reveal the gain in model fit and inference, and provides a new perspective into unraveling covariate-response relationships in presence of complexities posed by these data.

 Palestrante :  Flávio Ávila
Título:   
Recuperando gravações de áudio através da Estatística
Resumo
Sistemas de gravação e reprodução de áudio podem apresentar imperfeições que afetam a qualidade de experiência do ouvinte. Algoritmos de restauração se destinam a atuar no sinal degradado visando a torná-lo o mais parecido possível com o sinal originalmente gravado. Utilizando-se de técnicas de processamento estatístico de sinais, as quais permitem incorporar o conhecimento sobre o sinal de áudio e sobre os defeitos inseridos pelo sistema, tais algoritmos podem melhorar substancialmente a qualidade dos sinais, podendo em alguns casos tornar os defeitos imperceptíveis. Esta palestra apresentará uma revisão de técnicas existentes para alguns dos defeitos mais comuns em aplicações práticas, salientando as contribuições de alguns trabalhos que venho realizando recentemente com colaboradores.

 Palestrante :  Marcio Argollo de Menezes
Título:   
O que limita o crescimento celular? Uma abordagem sistêmica
Resumo
Abordaremos o metabolismo celular como um sistema de reações químicas interconectadas cujos fluxos derivam da solução de um problema de otimização, onde situações de crescimento constante se traduzem em vínculos de continuidade de massa. Descreveremos a abordagem matemática que nos fornece tais fluxos e, de posse do mapa de reações da bactéria E. Coli, mostramos que o volume celular finito atua como um vínculo importante, restringindo a produção das enzimas catalizadoras das reações a altas taxas de crescimento celular e provocando reorganizações globais nos fluxos. Finalmente, comparamos nossas previsões com experimentos e mostramos o sucesso desta abordagem.

 Palestrante :  Sidarta Ribeiro
Título:   
Sonho, Memória e Loucura
Resumo
Será abordado o importante papel do sono e dos sonhos na consolidação e restruturação de memórias, cruciais para o aprendizado e a criação de novas ideias. Noções freudianas serão postas em perspectiva, entre as quais a que postula a semelhança entre sonho e delírio psicopatológico. Como evoluiu a mente humana? Respostas serão buscadas numa perspectiva evolucionista, partindo do sono de nossos ancestrais mais remotos até chegar a fenomenologia dos sonhos contemporâneos, utilizando dados da genética, neurofisiologia de sistemas e psicologia.

 Palestrante :  Miguel Abadi
Título:   
Statistical properties for the occurrence times of rare events: an overview
Resumo
Since the famous Recurrence Theorem of Poincaré, the probabilistic analysis of occurrence times has been a subject of intense study, both in the area of stochastic process and dynamical systems. For instance, the non less famous Kac's Lemma is the first quantitative result. In this talk we will review some recent results (the last decade) giving precise quantitative information on the statistical laws for the many different kinds of occurrence times. Motivation comes from physical phenomena, DNA analysis, information theory, compression algorithms, game theory, among others.

 Palestrante :  Yuri Suhov
Título:   
Stochastic Aspects of Quantum Theory
Resumo
I plan to discuss examples of stochastic phenomena within a framework of Quantum Mechanics. These will include the uncertainty principle, teleportation and -- time permits -- localization. The talk will not assume preliminary knowledge of Quantum Mechanics or Probability Theory.

 Palestrante :  Jean Pierre Gazeau
Título:   
Integral quantization: Weyl-Heisenberg versus affine group
Resumo
After a few remarks about what we mean by quantization, I will explain the powerful role that operator-valued measure can play in quantizing any set equipped with a measure, for instance a group equipped with its (left) Haar measure. Integral quantizations based on the Weyl-Heisenberg group and on the affine group are compared. I will insist on the probabilistic aspects of such a procedure. An interesting application in quantum cosmology will be presented.

 Palestrante :  Glaura C Franco
Título:   
Observation driven time series models
Resumo
Modelos de séries temporais com parâmetros variando no tempo foram categorizados por Cox (1981) em duas classes: "observation driven models" e "parameter driven models". Nos modelos "observation driven", a variação temporal dos parâmetros é uma função de observações passadas e variáveis exógenas. Embora os parâmetros sejam estocásticos, eles são preditos perfeitamente condicional à informação passada. Este procedimento simplifica o cálculo da verossimilhança e explica porque estes modelos se tornaram populares na literatura estatística. Neste trabalho apresentaremos alguns "observation driven models" construídos na família exponencial de distribuições, tais como os modelos GARMA, GLARMA e GAS. Alguns exemplos e estudos de simulação são realizados para dados de contagem que seguem a distribuição de Poisson.

 Palestrante :  Josemar Rodrigues
Título:   
Modeling lifetimes by a stochastic process hitting a critical point
Resumo
First hitting times arise naturally in survival analysis where the underlying stochastic counting process represents the strength of the health of an individual. The patient experiences a clinical endpoint when this process reaches a critical point for the first time. We propose a very flexible and unified first hitting time density function in a stochastic carcino- genesis counting process, and its mathematical properties are investigated. The Poisson and negative binomial first hitting time models are addressed and two examples with real data are presented.

 Palestrante :  Artur Ávila
Título:   
Produtos aleatórios de matrizes e dinâmica de bilhares racionais
Resumo
Varias classes de sistemas dinâmicos muito determinísticos podem ser analisadas por meio de um operador de renormalização, o qual tipicamente tem propriedades caóticas que por sua vez permitem uma modelagem estocástica. Ilustraremos essa filosofia com uma discussão de como a solução de certas questões sobre bilhares racionais envolve o estudo de certas propriedades finas de produtos aleatórios de matrizes.

 Palestrante :  Marcia C. Barbosa
Título:   
Água: um líquido complexo
Resumo
Na maioria dos materiais a diminuição da temperatura implica aumento monotônico na densidade. Este não é o caso da água que apresenta a 4C um máximo na densidade. Além disso, observa-se um aumento não esperado na compressibilidade entre 0.1 MPa e 190 MPa e, a pressão atmosférica uma aumento no calor específico a pressão constante. Não somente a termodinâmica, mas igualmente a dinâmica da água é pouco usual. O coeficiente de difusão da água tem um máximo a 4C e 1.5 atm, enquanto para líquidos usuais a difusão aumenta com a diminuição de pressão. Neste seminário propomos que as anomalias da água podem ser explicadas por um potencial de duas escalas. Mostramos que esta hipótese pode ser comprovada em potenciais efetivos que reproduzem as anomalias da água. A ligação entre múltiplas escalas e a presença de anomalias é mostrada exatamente em um modelo em uma dimensão e observada por simulações em três dimensões.

 Palestrante :  Juan Carlos Pardo Fernández
Título:   
Nonparametric estimation of ROC curves and associated summary indices with covariates
Resumo
In medical studies the diagnostic of a patient is very often based on some characteristic of interest, which may lead to classification errors. These classification errors are calibrated on the basis of two indicators: sensitivity (probability of diagnosing an ill person as ill) and specificity (probability of diagnosing a healthy person as healthy).
When the diagnostic variable is continuous, the classification will necessarily be based on a cut-off value: if the variable exceeds the cut-off then the patient is classified as ill, otherwise the patient is classified as healthy. In this situation, it is of special interest the geometrical locus obtained when varying the cut-off values in the complement of the specificity versus the sensitivity. This geometrical locus is called the receiver operating characteristic curve (ROC curve), and it is of extensive use to analyse the discriminative power of the diagnostic variable. Some summary indicators, such as the area under the curve or Youden's index, are used to describe the main features of the ROC curve. The first part of the talk will be devoted to give a general introduction about ROC curves and present some nonparametric estimators.
In many studies, a covariate is avaliable along with the diagnostic variable. The information contained in the covariate may modify the discriminatory capability of the ROC curve, and therefore it is interesting to study the impact of the covariate on the conditional ROC curve. The second part of the talk will be devoted to the study of a nonparametric estimation procedure of the conditional ROC curve and its associated summary indices (conditional AUC and conditional Youden index). A data set concerning diagnosis of diabetes will be used as an illustration of the proposed methodology.

 Palestrante :  Thomas Mountford
Título:   
Stability for Poisson rain models
Resumo
We consider recent work of Foss and Baccelli on Poisson rain queuing models: On the lattice jobs arrive according to Poisson processes. A job requires a random amount of service time and a random collection of servers working simultaneously and servers must perform jobs on a first come first served manner. For this reason the job can only be started once all servers concerned are free from prior "committments" which may involve a server not doing anything even though work is available. We consider when the system may be stable (under sufficiently reduced arrival rates).


1º semestre de 2013
As palestras são realizadas no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos que ocorra aviso em contrário.


  • 19/06 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas )  
    • Serguei Popov (UNICAMP)
      Soft local times and decoupling of random interlacements (Resumo)
    • Carlos Alberto de Bragança Pereira (USP)
      Nested hypotheses: an example in Genetics (Resumo)
  • 18/05 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas )  
    • Álvaro Veiga (PUC-Rio)
      Modelos estocásticos para avaliação de contratos de energia (Resumo)
    • Claudio Landim (IMPA)
      Comportamento metaestável de processos markovianos (Resumo)
  • 17/04  Alexandre Rodrigues (UFES)
    Título:  A spatio-temporal model to point source modelling in criminology, a closed circuit television camera application (Resumo)
  • 10/04  Dalton F. Andrade (UFSC)
    Título:  Teoria da Resposta ao Item - TRI: principais conceitos, tópicos de pesquisa e suas aplicações em diferentes áreas (Resumo)
  • 16/03 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas no Auditório Ricardo Mañé do IMPA)  
    • Hugo Duminil-Copin (Université de Geneve)
      Critical point of two-dimensional statistical physics models (Resumo)
    • Laerte Sodré Jr. (IAG-USP)
      Ciência com grandes levantamentos de galáxias (Resumo)
  • 04/03  Marcos O. Prates (UFMG)
    Título:  A Bayesian approach to estimate the abundance of anchovie in the coast of Peru (Resumo)
  • 17/01  Francisco Louzada Neto (USP-SC) (excepcionalmente as 14:00hs no Salão Nobre da Decania, CCMN. )
    Título:  Modelagem Estatística para Dados Esportivos (Resumo)


Resumos das palestras do 1º semestre de 2013

 Palestrante :  Serguei Popov
Título:   
Soft local times and decoupling of random interlacements
Resumo
We establish a decoupling feature of the random interlacement process Iu in Zd, at level u, for d = 3. Roughly speaking, we show that observations of Iu restricted to two disjoint subsets A1 and A2 of Zd are approximately independent, once we add a sprinkling to the process Iu by slightly increasing the parameter u. Our results differ from previous ones in that we allow the mutual distance between the sets A1 and A2 to be much smaller than their diameters. We then provide an important application of this decoupling for which such flexibility is crucial. More precisely, we prove that, above a certain critical threshold u**, the probability of having long paths that avoid Iu is exponentially small, with logarithmic corrections for d = 3. To obtain the above decoupling, we first develop a general method for comparing the trace left by two Markov chains on the same state space. This method is based in what we call the soft local time of a chain. In another crucial step towards our main result, we also prove that any discrete set can be smoothened into a slightly enlarged discrete set, for which its equilibrium measure behaves in a regular way. This is a joint work with Augusto Teixeira.

 Palestrante :  Carlos A. B. Pereira
Título:   
Nested hypotheses: an example in Genetics
Resumo
Initial Comment: Treating nested hypotheses is an old important challenge to statisticians. To dramatize the motivation we have chosen an important and common problem in population and human genetics. This talk is based on the article by R. Izbicki, V. Fossaluza, A. G. Hounie, E. Y. Nakano, C. A. Pereira (2011), Testing allele homogeneity: The problem of nested hypotheses, BMC Genetics 13:103.
Conclusions: The allelic and genotypic homogeneity test usually described in the literature shows undesira- ble inconsistencies on its results. We show that even when using a proper frequentist procedure to test allelic homogeneity these inconsistencies still occur. There are no flaws when e- values are used instead. A routine that performs all tests considered in this paper in R Software can be downloaded on www.ime.usp.br/ cpe- reira/programs/nested.r.

 Palestrante :  Álvaro Veiga
Título:   
Modelos estocásticos para avaliação de contratos de energia
Resumo
A comercialização de energia elétrica no Brasil pode ser realizada em dois ambientes: um regulado, de menor risco porém pouco flexível, e o ambiente livre, onde há maior flexibilidade. Neste caso, se, no momento da entrega da energia, o gerador não for capaz de produzir o necessário, ele deverá comprar a energia faltante no mercado aberto de energia (MAE) ao Preço de Liquidação de Diferenças (PLD). Analogamente, se houver mais energia do que exige o contrato, o gerador pode vender a energia no MAE pelo PLD. O PLD é determinado pelo ONS (Operador Nacional do Sistema) via um programa de otimização estocástica (NEWAVE) que determina a operação ótima do sistema elétrico. Sendo assim, o resultado financeiro do contrato está submetido a variação de duas variáveis: a produção de energia e o PLD. No caso de energias renováveis - usinas hidrelétricas sem reservatório, usinas eólicas e solares - a energia gerada estará exposta a variações meteorológicas fora do seu controle. A determinação da distribuição de probabilidades do valor dos contratos de energia depende, portanto, do conhecimento da distribuição de probabilidades conjunta desses fatores: geração e PLD.

 Palestrante :  Claudio Landim
Título:   
Comportamento metaestável de processos markovianos
Resumo
Investigaremos o comportamento assintótico de três processos markovianos cujos estados estacionários apresentam mais de um estado fundamental: 1. Um sistema de partículas no qual uma parcela macroscópica das partículas se concentra em um único sítio. 2. Um passeio aleatório em meio a armadilhas aleatórias. 3. Uma dinâmica conservativa para o modelo de Ising bi-dimensional em uma caixa grande quando a temperatura decresce a zero. Ilustraremos com estes três modelos técnicas desenvolvidas recentemente para analisar este tipo de processos. A palestra será elementar e exigirá apenas noções de processos markovianos a tempo contínuo.

 Palestrante :  Alexandre Rodrigues
Título:   
A spatio-temporal model to point source modelling in criminology, a closed circuit television camera application
Resumo
In this paper we propose a semi-parametric spatio-temporal method for point process modelling with point source interventions. We use this new methodology to map the temporal degradation of the effect of the installation of 60 Closed Circuit Television Cameras (CCTV) in a criminal hot spot region of Belo Horizonte, Brazil.

 Palestrante :  Dalton F. Andrade
Título:   
Teoria da Resposta ao Item - TRI: principais conceitos, tópicos de pesquisa e suas aplicações em diferentes áreas
Resumo
Nesta palestra iremos abordar aspectos teóricos e aplicados da TRI, Após uma apresentação de seus principais conceitos e modelos, abordaremos alguns tópicos relacionados com o processo de calibração (estimação dos parâmetros dos itens) e da estimação das proficiências/habilidades (traço latente). Em particular, o chamado Efeito Prova. Por último, apresentaremos aplicações da TRI nas mais diferentes áreas do conhecimento, com uma aplicação de um Modelo Multidimensional.

 Palestrante :  Hugo Duminil-Copin
Título:   
Critical point of two-dimensional statistical physics models
Resumo
Physical systems may abruptly change their macroscopic behavior as one of their thermodynamical quanti- ties varies through a critical point. In this talk, we describe two ways of computing critical points for statistical physics models through two important examples (the so-called FK percolation and the Self-Avoiding Walk model). Identifying these points is a crucial step towards the understanding of the phase transition for these models. We will insist on standard techniques used in rigorous planar statistical physics (such as coupling and duality arguments) and on two novel techniques (sharp threshold and discrete holomorphicity) developed over the past few years. The talk is partly based on joint works with V. Beffara and S. Smirnov. It will be accessible to a general mathematical audience.

 Palestrante :  Laerte Sodré Jr.
Título:   
Ciência com grandes levantamentos de galáxias
Resumo
Levantamentos de redshifts de galáxias, cobrindo áreas extensas no céu, são uma das mais importantes ferramentas astrofísicas da atualidade, por permitir atacar diversos problemas cruciais da física contemporânea, como as propriedades da energia escura e o comportamento da gravitação em grandes escalas. Nesse seminário explicarei o que são esses levantamentos, quais são seus objetivos científicos, alguns dos seus grandes desafios (inclusive estatísticos!) e descreverei brevemente alguns desses levantamentos, como o JPAS, SMAPS e PFS/SuMIRe.

 Palestrante :  Marcos O. Prates
Título:   
A Bayesian approach to estimate the abundance of anchovie in the coast of Peru
Resumo
The Northern Humboldt Current System (HCS) is the world most productive ecosystem in terms of fish. Peruvian anchovy (Engraulis ringens) is one of the most abundant species in the Northern HCS. Anchovy is the major prey of the principal predators, like mammals, seabirds, fish and fishers. In this context, it is important to study anchovy abundance not only from an ecological perspective but also from an economic one. From both ends, ecological and economic, it is important to understand the dynamics of anchovy population to preserve it as well as to explore its economical capacities. Using the data collected by the 'Instituto del Mar del Peru' (IMARPE), during a scientific survey in 2005, we present a statistical analysis that has as main goals: (1) adapt to the characteristics of the sampled data, such as spatial dependence, high proportions of zeros and big samples size and (2) provide important insights on the anchovy population dynamics. The collected data is analyzed in a Bayesian framework using the integrated nested Laplace Approximation (INLA) methodology.


1o. semestre de 2012
As palestras são realizadas no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos que ocorra aviso em contrário.


  • 13/06 Bernardo N. B. de Lima (UFMG)
    Título: Percolação congelada na rede quadrada (Resumo)
  • 06/06 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:00 horas no Auditório 1 do IMPA)  
    • Robert Morris (IMPA)
      Noise sensitivity in percolation (Resumo)
    • Ivan S. Oliveira (CBPF)
      O fantástico computador quântico de dois q-bits: aplicações utilizando ressonância magnética nuclear (Resumo)
  • 30/05 Marco Ferreira (Missouri)
    Título: Bayesian optimal sequential design for nonparametric regression (Resumo)
  • 16/05 Luca Martino (Carlos III)
    Título: Some computational methods for Bayesian inference: from rejection samplers to Markov chains (Resumo)
  • 02/05 Jorge Achcar (USP)
    Título: Modelling the dependence between two diagnostic tests via copula functions (Resumo)
  • 27/04 Renato J. Gava (USP) (excepcionalmente uma 6a feira)
    Título: The K-process on a tree as a scaling limit of the GREM-like trap model (Resumo)
  • 18/04 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 13:30 horas na sala C116 do IM)  
    • Thereza C. L. Paiva (IF-UFRJ)
      Férmions ultra-frios em redes óticas (Resumo)
    • Leandro R. Pimentel (IM-UFRJ)
      Modelos de crescimento e interfaces de competição (Resumo)
  • 11/04 Eliane Rodrigues (UNAM)
    Título: Alguns modelos Markovianos para estudar o tempo entre ultrapasses de limites para concentração de ozonio (Resumo)
  • 28/03 Sergio Camiz (Roma)
    Título: Exploratory data analysis for the study of images recognition tests (Resumo)
  • 21/03 Luigi Ippoliti (Pescara)
    Título: Space-time modeling of US house prices by spatial dynamic structural equation models (Resumo)
  • 09/03 Jorge L. Bazan (PUC, Peru) (excepcionalmente uma 6a feira)
    Título: A proposal for skewed links in binary regression (Resumo)
  • 18/01 Matthias Kormaksson (Cornell) (excepcionalmente as 13:30)
    Título: Mixture of generalized linear mixed models with applications in methylation sequencing and proteomics analysis (Resumo)

Resumos das palestras do 1o semestre de 2012

Palestrante:  Bernardo Lima
Título:  
Percolação congelada na rede quadrada
Resumo
Percolação congelada foi introduzida por D. Aldous como um modelo prababilístico para a formação de um gel. Dada uma sequência de variáveis aleatótias iid, (U_v), com distribuição uniforme em [0,1] onde v é um vértice do grafo, o medelo é definido da seguinte maneira: no tempo t=0 todos os sítios estão inativos, o sítio v passa para o estado ativo no tempo U_v, quando se forma um aglomerado infinito de sítios ativos todos os sítios deste aglomerado passam para o estado congelado. Deste modo, no tempo t=1 todos os sítios estão ativos ou congelados.
Estudamos uma modificação deste processo, na rede quadrada, onde o aglomerado congela quando seu diâmetro atinge o valor N. Mostramos que no limite quando N tende ao infinito a probabilidade da origem estar ainda ativa é estritamente positiva. Trabalho conjunto com J. van den Berg (CWI, Amsterdã) e Pierre Nolin (ETH, Zurique).

Palestrante:  Robert Morris
Título:  
Noise sensitivity in percolation
Resumo
Suppose that in a close election, a small (random) proportion of the votes are accidentally miscounted; is this random `noise' likely to change the outcome of the election? It turns out that the answer to this question depends in interesting ways on the rule (i.e., the Boolean function f) by which the winner is selected. To take three simple examples, the answer is ``no'' if the function f is `majority' or `dictator', but ``yes'' if it is `parity'. The systematic study of this problem was begun in 1999 by Benjamini, Kalai and Schramm, who gave a sufficient condition (based on the discrete Fourier coefficients of f) for the answer to be ``yes'', and used this result to prove that bond percolation on Z² is noise sensitive at criticality. More precisely, suppose that we perform critical (i.e., p = 1/2) bond percolation on Z², observe that there is a horizontal crossing of a particular n x n square, and then re-randomize each edge with probability epsilon > 0. Then the probability of having a horizontal crossing in the new configuration is close to 1/2. In this talk we consider the corresponding question for continuum percolation, and in particular for the Poisson Boolean model (also known as the Gilbert disc model). Let eta be a Poisson process of density lambda in the plane, and connect two points of eta by an edge if they are at distance at most 1. We prove that, at criticality, the event that there is a crossing of an n x n square is noise sensitive. The proof is based on two extremely general tools: a version of the BKS Theorem for product measure, and a new extremal result on hypergraphs. This is joint work with Daniel Ahlberg, Erik Broman and Simon Griffiths.

Palestrante:  Ivan S. Oliveira
Título:  
O fantástico computador quântico de dois q-bits: aplicações utilizando ressonância magnética nuclear
Resumo
A Computação Quântica, ou mais genericamente, o Processamento da Informação Quântica, surgiu como uma área da física teórica no início dos anos 1980. A partir de 1994, com a descoberta do algoritmo de fatoração de Shor um grande número de pesquisadores foram atraídos para esta área, e e em 1997, a Ressonância Magnética Nuclear (RMN) despontou como uma das técnicas experimentais mais promissoras para a implementação de protocolos de computação e comunicação quânticos. Logo se percebeu, contudo, que o chamado problema do escalonamento, seria muito difícil de ser superado por qualquer técnica experimental em vigor, em particular a RMN. Os trabalhos então se concentraram em aspectos básicos do processamento da informação quântica em sistemas com um número pequeno de q-bits, a unidade de informação quântica. A RMN encontrou aí um nicho extraordinário para estudos fundamentais sobre emaranhamento, simulação de sistemas quânticos, e descoerência. Neste colóquio vamos apresentar os fundamentos do Processamento da Informação Quântica por RMN, com vários exemplos de estudos em um sistema com apenas 2 q-bits de informação, o mais simples de todos: a molécula do clorofórmio. Ênfase será dada aos trabalhos feitos pelo Grupo de Informação Quântica por RMN do Centro Brasileiro de Pesquisas Físicas.

Palestrante:  Marco Ferreira
Título:  
Bayesian optimal sequential design for nonparametric regression
Resumo
We develop a novel computational framework for Bayesian optimal sequential design for nonparametric regression. This computational framework is based on evolutionary Markov chain Monte Carlo (EMCMC), which combines ideas of genetic or evolutionary algorithms with the power of Markov chain Monte Carlo. Our framework is able to consider general models for the observations, such as exponential family distributions and scale mixtures of normals. In addition, our framework allows optimality criteria with general utility functions that may include competing objectives, such as for example minimization of costs, minimization of the distance between true and estimated functions, and minimization of the prediction error. Finally, we illustrate our novel methodology with applications to experimental design for nonparametric function estimation.

Palestrante:  Luca Martino
Título:  
Modelling the dependence between two diagnostic tests via copula functions
Resumo
Rejection sampling (RS) is a standard technique for universal Monte Carlo sampling. It can be used to generate i.i.d. samples from a target probability density function (pdf) by drawing from a simpler proposal density. The class of adaptive rejection sampling (ARS) methods are particularly appealing because they ensure high acceptance rates. Indeed they produce a sequence of proposal functions that actually converge toward the target pdf when the procedure is iterated. We will discuss a a novel family of generalized ARS algorithms which are applicable to a broad range of target densities and, furthermore, admit an efficient combination with other sampling techniques such as the "ratio of uniforms" method. In many practical applications, rejection samplers cannot provide a complete solution to the inference problems to be solved (e.g., when the target distribution is large dimensional) but they can still become useful blocks for the design of more sophisticated algorithms, such as Markov chain Monte Carlo (MCMC) methods. We will describe certain MCMC algorithms as the Multiple Try MH (MTM) technique and how the latter can be generalized using either generic weight functions or ARS building blocks. Some numerical examples will be provided for illustration.

Palestrante:  Jorge Achcar
Título:  
Modelling the dependence between two diagnostic tests via copula functions
Resumo
In medical diagnostic testing, it is common the use of more than one diagnostic test applied to the same individual. Usually these tests are assumed to be independents and important performance measures are estimated as the sensitivities and specificities of the tests, in the presence or not of a reference test usually known as "gold standard". These tests could be dependent since they are applied to the same individual and this assumption could modify the estimation of the performance measures. Considering two diagnostic tests, we could assume a bivariate Bernoulli distribution. Alternatively, we propose the use of different copula functions to model the association between tests. Under the Bayesian paradigm, the posterior summaries of interest are obtained using MCMC (Markov Chain Monte Carlo) methods. A detailed discussion on the elicitation of prior distributions on the test performance and copula parameter is considered in this study.We illustrate the proposed methodology considering two medical data sets introduced in the literature.

Palestrante:  Renato J. Gava
Título:  
The K-process on a tree as a scaling limit of the GREM-like trap model
Resumo
We introduce trap models on a finite volume k-level tree as a class of Markov jump processes with state space the leaves of that tree. They serve to describe the GREM-like trap model of Sasaki-Nemoto. Under suitable conditions on the parameters of the trap model, we establish its infinite volume limit, given by what we call a K process in an infinite k-level tree. From this we deduce that the K-process also is the scaling limit of the GREM-like trap model on extreme time scales under a fine tuning assumption on the volumes. This is a joint work with L. R. G. Fontes, V. Gayrard. 

Palestrante:  Leandro Pimentel
Título:  
Modelos de crescimento e interfaces de competição
Resumo
Nesta palestra faremos uma viagem pela teoria de modelos de crescimento percolativos e suas interfaces de competição. Veremos resultados clássicos, como o teorema da forma, bem como resultados recentes sobre a forma da interface de competição, além de problemas fundamentais que ainda estão em aberto.

Palestrante:  Thereza C. L. Paiva
Título:  
Férmions ultra-frios em redes óticas
Resumo
A habilidade de aprisionar átomos bosônicos e fermiônicos em redes óticas, cujo potencial cristalino é gerado por lasers anti-propagantes, a temperaturas ultra baixas, deu início a uma nova área de pesquisa, na fronteira entre a Física da Matéria Condensada, a Física Atômica e a Ótica. Ao contrário do que acontece nos sistemas de Matéria Condensada, nas redes óticas há um grande controle sobre os parâmetros envolvidos: as interações entre os átomos são controladas através de um campo magnético, podendo ser atrativas ou repulsivas, o potencial químico é facilmente controlável e não há desordem. Com isso, um novo desenvolvimento nesta área é a possibilidade de realizar em laboratório modelos para férmions fortemente correlacionados, dentre os quais o mais estudado é o modelo de Hubbard. Atualmente, o principal desafio nesta área é conseguir o resfriamento necessário para observar fases ordenadas, como antiferromagnetismo, supercondutividade ou superfluidez. Neste colóquio vou discutir os avanços experimentais e teóricos mais recentes nesta área.

Palestrante:  Eliane Rodrigues
Título:  
Alguns modelos Markovianos para estudar o tempo entre ultrapasses de limites para concentração de ozonio
Resumo
Apresentaremos alguns modelos Markovianos para descrever a estrutura de tempos entre ultrapasses de limites ambientais. Assumimos que tempos consecutivos são dependentes. Duas possibilidades serão consideradas. No primeiro caso, a dependência é imposta diretamente na sequência dos tempos entre ultrapasses. No segundo caso, a dependência é imposta nos parâmetros de escala e forma das densidades assumidas para os tempos entre ultrapasses. Os modelos descritos serão aplicados a medições de ozono obtidas da rede de monitoramento da Cidade do México. Os resultados apresentados fazem parte de trabalhos conjuntos com Jorge A. Achcar, Guadalupe Tzintzun, Mario Tarumoto e Edilberto Cepeda-Cuervo.

Palestrante:  Sergio Camiz
Título:  
Exploratory data analysis for the study of images recognition tests
Resumo
The study concerns the exploratory study carried out to provide items to be submitted to aphasic patients, to evaluate their degree of desease. This preliminary study is devoted to the identifications of images to be submitted, by selecting them from an internationally adopted set of images. To select them we proceeded in two steps: i) the selection of the images based on their facility to be easily to be recognized by the patients; and ii) the evaluation of the primitiveness of the objects' nouns to be verbalised, aiming at limiting attention to the most primitive ones. Both steps were carried out by submitting items to non-aphasic judges, in order to evaluate in a neutral way the quality of the items themselves. Thus images were submitted to Correspondence Analysis, to identify those least recognized by the judges, in order to exclude them in the further step. Then, the selected objects were submitted to two sets of judges to evaluate their degree of primitiveness, according to: i) a predefined seven-steps age scale, and ii) a 1-7 free scale. The results were submitted first to both Principal Component and Multiple Correspondence Analyses, to withdraw any judge that resulted an outlier in respect to others. Then, the remaining data were analysed through Multiple Factor Analysis, to compare to what extent the two scales of measurement gave different results: it appeared that the free-scale allowed the judges to use the whole scale, whereas the predefined one caused the selection of a limited number of steps. Nevertheless, its first principal component, that is the objects' scores along the first axis, could be assumed as a measure of primitiveness. 

Palestrante:  Luigi Ippoliti
Título:  
Space-time modeling of US house prices by spatial dynamic structural equation models
Resumo
This talk discusses a spatial dynamic structural equation model for the analysis of house prices at the State level in the USA. The study contributes to the existing literature by extending the use of dynamic factor models to the econometric analysis of multivariate lattice data. One of the main advantages of our model formulation is that by modeling the spatial variation via spatially structured factor loadings, we entertain the possibility of identifying similarity ”regions” that share common time series components. The factor loadings are modeled as conditionally independent multivariate Gaussian Markov Random Fields while the common components are modeled by latent and dynamic factors. The general model is proposed in a state-space formulation where both stationary and nonstationary autoregressive distributed-lag processes for the latent factors are considered. For the latent factors which exhibit a common trend, and hence are cointegrated, an error correction specication of the (vector) autoregressive distributed-lag process is proposed. Full probabilistic inference for the model parameters is facilitated by adapting standard Markov chain Monte Carlo (MCMC) algorithms for dynamic linear models to our model formulation. The fit of the model is discussed for a data set of 48 States for which we model the relationship between housing prices and the macroeconomy, using state level unemployment and per capita personal income.

Palestrante: Jorge L. Bazan
Título:  
A proposal for skewed links in binary regression
Resumo
We propose two new classes of links for the modeling of mixed models for binary response. We shows that these extensions are appropriate for the analysis of several typesof correlated data structures, in particular, for clustered and/or longitudinaldata and, more generally, in multilevel models. The links proposed can be named as power and reciprocal power by considering the relationship between them. Both include usual symmetric links as logit and probit as special cases. Also,the univariate and the random effects for symmetric links in binary regression are special cases of the models considered here. A Bayesian inference approach using MCMC is developed.

Palestrante: Matthias Kormaksson
Título:  
Mixture of generalized linear mixed models with applications in methylation sequencing and proteomics analysis
Resumo
For many high-dimensional data a common goal is to test thousands of features against some null hypothesis. This simultaneous testing problem has been studied extensively over the last decade in the context of continuous microarray data. However, little attention has been given to a new class of data that are arising in several fields, including Genomics, Epigenomics, and Proteomics. These data, so called Next Generation Sequencing Data, are measured at a much higher resolution than regular microarray data and are not continuous but  rather come in the form of counts or proportions. For these data new methods are needed to discover features that show a statistical difference across conditions. To address this need, we have developed a three groups mixture model, which can be applied to data that follow distributions in the exponential dispersion family. The proposed model fits into a framework that we call Mixture of Generalized Linear Mixed Models (MGLMM) and applies to a variety of high-dimensional data. In this talk I will present the MGLMM model and apply it to two different data sets arising in Methylation Sequencing and Proteomics Analysis. I will also present some simulation results that suggest a superior performance over the current methods being employed. 



2o. semestre de 2011
As palestras são realizadas no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos que ocorra aviso em contrário.


  • 14/12 David Rohde (UFRJ)
    Título:  Learning latent factor models with the online EM algorithm (Resumo)
  • 12/12 Anders Skrondal (Oslo) (excepcionalmente uma 2a feira)
    Título:  Can biological interaction be investigated in case-control studies? (Resumo)
  • 23/11 Colóquio Inter-institucional "Modelos estocásticos e aplicações" (excepcionalmente as 14:30 horas no CBPF)  
    • Sacha Friedli (UFMG)
      Percolação com uma linha de defeitos (Resumo)
    • Claudia Domingues Vargas (UFRJ)
      Motor cognition: neurophysiological underpinning of planning, imagining and predicting upcoming actions (Resumo)
  • 16/11 Jon Wakefield (Washington)
    Título:  A hierarchical approach to modeling allele-specific gene expression (Resumo)
  • 11/11 J. N. K. Rao (Carleton) (excepcionalmente uma 6a feira as 13:30 horas)
    Título:  Robust small area estimation (Resumo)
  • 09/11 Enrique Andjel (IMPA)
    Título:  Percolação de primeira passagem e estratégias de evasão (Resumo)
  • 19/10 Edilberto Cepeda (Bogotá)
    Título:  Bayesian beta regression models: extensions and aplications
  • 05/10 Simon Griffiths (IMPA)
    Título:  On explosions in heavy-tailed branching random walks (Resumo)
  • 21/09 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente as 14:00 horas na UFF)  
    • Valderio A. Reisen (UFES)
      Robust estimation in time series, unit root test based on ranks and counting process (Resumo)
    • Enrique D. Andjel (Provence)
      O teorema ergódico subaditivo e suas aplicações (Resumo)
  • 11/08 Colóquio institucional (excepcionalmente as 14:30 horas)  
    • Luiz Raul Pericchi (Puerto Rico)
      Limiting the shrinkage for the exceptional: the Clemente problem (Resumo)
    • Omiros Papaspiliopoulos (Pompeu Fabra)
      Nonparametric estimation of diffusions: a differential equations approach (Resumo)
  • 27/07 Petros Dellaportas (Atenas)
    Título:  Control variates in reversible MCMC samplers  (Resumo)

Resumos das palestras do 2o semestre de 2011

Palestrante: David Rohde
Título:  
Learning latent factor models with the online EM algorithm
Resumo
Latent factor models are a general class of graphical model with wide applications in to name a few examples topic modelling, recomender systems and signal processing.
In this talk I will talk about this class of model and discuss how fully Bayesian and semi-Bayesian approaches benefit from the exponential family representation. Finally I will talk about my recent work applying the online EM algorithm to this class of problem.

Palestrante: Anders Skrondal
Título:  Can biological interaction be investigated in case-control studies?
Resumo
It is argued by prominent epidemiologists that assessment of interaction should be based on departures from additive rates or risks. Unfortunately, in case-control studies the corresponding "fundamental interaction parameter" can usually not be estimated. To overcome this problem, epidemiologists have proposed surrogate measures of interaction based on relative risks from logistic models. In this talk we investigate the performance of these measures in practice, where covariates must be included to control for confounding. We uncover two fundamental problems with the advocated approach and suggest an approach that rectifies the problems.

Palestrante: Claudia Domingues Vargas
Título:  Motor cognition: neurophysiological underpinning of planning, imagining and predicting upcoming actions
Resumo
Motor systems are exquisitely adapted to transform an action goal into the production of a movement of greatest fit in a given context. This transformation, called motor planning, is thought to be performed through internal models of actions. These models operate by continuously monitoring the motor output and by making future predictions of changes in body states and of the immediate environment. Because of the delays inherent to sensorimotor processing, the ability to predict the future state of the motor system in a variable environment (context) is considered crucial to create efficient movements and appropriate behaviors. In this colloquium I intend to explore how the brain activity associated with motor planning changes as a function of the context in which this movement shall be performed. Furthermore, I will present results showing that lesions in specific brain regions can affect the capacity of making predictions of one's own and/or of other's upcoming actions.

Palestrante: Sacha Friedli
Título:  Percolação com uma linha de defeitos
Resumo
É bem conhecido que em sistemas subcríticos a correlação entre pontos distantes descresce exponencialmente com a distância. Nesta palestra consideraremos o processo de percolação de Bernoulli, em que elos da rede cúbica são independentemente abertos com probabilidade p, e fechados com probabilidade 1-p. Introduziremos uma linha de defeitos em que os elos são abertos com probabilidade p' < p, e estudaremos o efeito de p' e da dimensão sobre o decaimento exponencial da fase subcrítica. Em particular pretendemos apresentar (de maneira não-técnica) a origem da influência de p' e a sua conexão com as propriedades de recorrência/transiência de um passeio aleatório com incrementos independentes.

Palestrante: Jon Wakefield
Título:  A hierarchical approach to modeling allele-specific gene expression
Resumo
Variation in gene expression is thought to make a significant contribution to phenotypic diversity among individuals within populations. We measured allele-specific gene expression (ASE) in a diploid hybrid of two diverse Saccharomyces cerevisiae strains using RNA-Seq. To capitalize on the wealth of information contained in RNA-Seq data sets, we developed a powerful and flexible hierarchical Bayesian model that combines information across loci to allow both global and locus-specific inferences about ASE. We show that we are able to accurately quantify levels of ASE with specified false discovery rates, achieving high reproducibility between independent sequencing platforms. A key feature of the model is the use of additional genomic DNA data to calibrate the null model. We pinpoint loci that show unusual and biologically interesting patterns, including allele-specific alternative splicing and allele-specific transcription start sites. Joint work with Dan Skelly and Josh Akey.

Palestrante: J. N. K. Rao
Título:  Robust small area estimation
Resumo
A subpopulation or domain is called a small area if the area-specific sample size is small or even zero. Traditional area specific direct estimators of means are not suited for small areas and it is necessary to use indirect estimators that borrow strength across related areas. Small area estimation has been extensively studied under linking models based on linear mixed models. Empirical best linear unbiased prediction (EBLUP) estimators of small area means have been developed along with nearly unbiased estimators of mean squared errors. However, EBLUP estimators can be sensitive to outliers. In this talk, I will first present a robust EBLUP type method for small area estimation and demonstrate its advantage over the customary EBLUP under unit level nested error linear regression models in the presence of outliers in the random small area effects and/or unit level errors. I will also study a bootstrap method of estimating the mean squared error of the robust EBLUP type estimator. Secondly, I will relax the assumption of linear regression model for the fixed part of the linear mixed model and replace it by the weaker assumption of a penalized-spline regression model and develop robust EBLUP type estimators of small area means in the presence of outliers in the random small area effects and /or unit level errors. I will also discuss bootstrap estimators of mean squared error. Simulation results and applications to real data will also be presented.

Palestrante: Enrique Andjel
Título:  Percolação de primeira passagem e estratégias de evasão
Resumo
Consideramos o modelo de percolacao de primeira passagem em Z^d dado por v.a. i.i.d. de distribuição F. Sejam t_{\pi}(u,v) o tempo pra passar de u a v pelo caminho \pi e t(u,v) o minimo destes tempos considerando todos os caminhos de u a v. Perguntamos se existe pontos x e y e um caminho semi-infinito \pi=(y_0=y,y_1,...) tal que t_{\pi}(y,y_{n+1})

Palestrante: Simon Griffiths
Título: On explosions in heavy-tailed branching random walks
Resumo
Consider a branching random walk on the real numbers, with offspring distribution Z and non-negative displacement distribution W. We say that explosion occurs if an infinite number of particles may be found within a finite distance of the origin. In this talk, we discuss the problem of characterising pairs (Z, W) for which explosion occurs a.s. In particular, in the case that the offspring distribution Z has a sufficiently heavy tail we give a necessary and sufficient condition on W for explosion to occur. Furthermore, we demonstrate that our condition on the tail is best possible for this equivalence to occur. Joint with Omid Amini, Luc Devroye and Neil Olver.

Palestrante: Enrique D. Andjel
Título: O teorema ergódico subaditivo e suas aplicações
Resumo
O teorema ergódico subaditivo foi inicialmente provado por Kingman. Ele dá condições suficientes para convergência quase certa de X_n/n onde {X_n} é uma sequência subaditiva de variáveis aleatórias. Veremos como uma versão um pouco mais geral deste teorema permite deduzir resultados de interesse para a percolação de primeira passagem e para alguns sistemas de partículas unidimensionais, como o processo de contato ou o processo de exclusão.

Palestrante: Valderio A. Reisen
Título:  Robust estimation in time series, unit root test based on ranks and counting process
Resumo
In this talk the following research topics will be discussed.
Robust estimation: It is well-known that the sample autocovariance is not robust to the presence of additive outliers. Hence, the definition of an autocovariance estimator which is robust to additive outlier can be very useful for time-series modeling. The robust autocovariance estimator proposed by Ma and Genton (2000) is studied and applied to time series with different correlation structures such as short and long memory. Based on the robust autocorrelation function, a robust estimator of the parameter d in ARFIMA(p, d, q) is proposed. Some simulations are used to support the use of this method when a time series has additive outliers.
DF unit root test based on ranks: In this subject, the classical Dickey-Fuller (DF) test will be studied in the context of unit root time series with outliers. Based on the ranks of the observations, a robust DF test is proposed. The test is robust against outliers observations. The asymptotic distribution of the test is obtained.
Counting process: The Integer-valued Autoregressive Moving Average (INARMA) models have suggested modeling observed count time series. This research is concerned with the problem of modeling INAR processes under seasonal, unit root and long memory properties.

Palestrante: Omiros Papaspiliopoulos
Título: Nonparametric estimation of diffusions: a differential equations approach
Resumo
We consider estimation of scalar functions which determine the dynamics of diffusion processes. It has been recently shown that nonparametric maximum likelihood is ill-posed in this context. We adopt a probabilistic approach to regularize the problem by the adoption of a prior distribution for the unknown functional. A Gaussian prior measure is specified in the function space by means of its precision operator, which is defined as an appropriate differential operator. We establish that a Bayesian Gaussian conjugate analysis for the drift of one-dimensional non-linear diffusions is feasible given high-frequency data. This is achieved by expressing the log-likelihood as a quadratic function of the drift, with sufficient statistics given by the so-called local time process and the end points of the observed path. Computationally efficient posterior inference is carried out using a finite element method.
We embed this technology in partially observed situations and adopt a data augmentation approach whereby we iteratively generate missing data paths and draws from the unknown functional. Our methodology is applied to estimate the drift of models used in molecular dynamics and financial econometrics using high and low frequency observations. We discuss extensions to other partially observed schemes and connections to other types of non-parametric inference.
Joint work with Yvo Pokern (UCL), Gareth O. Roberts (Warwick) and Andrew M. Stuart (Warwick)

Palestrante: Luiz Raul Pericchi
Título: Limiting the shrinkage for the exceptional: the Clemente problem
Resumo
Modern Statistics is made of the sensible combination of direct evidence (the data directly relevant or the "individual data") and indirect evidence (the data and knowledge indirectly relevant or the "group data"). The admissible procedures are a combination of the two sources of information, and the advance of technology is making indirect evidence more substantial and ubiquitous. It has been pointed out however, that in "borrowing strength" a fundamental problem of Statistics is to treat in a fundamentally different way exceptional cases, cases that do not adapt to the central "aurea mediocritas". This is what has been recently coined as "the Clemente problem", Efron (2010). In this article we put forward that the problem is caused by the simultaneous use of square loss function and conjugate (light tailed) priors which is the usual procedure. We propose in their place to use robust penalties, in the form of losses that penalize more severely huge errors, or (equivalently) priors of heavy tails which make more probable the exceptional. Using heavy tailed prior we can reproduce in a Bayesian way, Efron and Morris' "limited translated estimators" (with Double Exponential Priors) and "discarding priors estimators" (with Cauchy-like priors) which discard the prior in the presence of conflict. Both Empirical Bayes and Full Bayes approaches are able to alleviate the Clemente Problem and furthermore beat the James- Stein estimator in terms of smaller square errors, for sensible Robust Bayes priors. We model in parallel Empirical Bayes and Fully Bayesian hierarchical models, illustrating that the differences among sensible versions of both are minute, as compared with the effect due to the robust assumptions. We also propose a heavy tailed Beta2 distribution for variances that arises naturally as an alternative to the usual Inverted-Gamma distribution. This adds stability and robustness, and strickenly produce a marginal for the location, which is the first known "Horseshoe" (optimal) prior in closed analytical form. This has been put recently to the test Fuquene, Perez and Pericchi (2011) in a Dynamical Bayesian model for detection of structural changes and outliers.

Palestrante: Petros Dellaportas
Título: Inferência Bayesiana em um modelo Control variates in reversible MCMC samplers
Resumo
A general methodology is presented for the construction and effective use of control variates for reversible MCMC samplers. The values of the coefficients of the optimal linear combination of the control variates are computed, and adaptive, consistent MCMC estimators are derived for these optimal coefficients. All methodological and asymptotic arguments are rigorously justified. Numerous MCMC simulation examples from Bayesian inference applications demonstrate that the resulting variance reduction can be quite dramatic.


1o. semestre de 2011
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 06/07 Caio L. N. Azevedo (UNICAMP) (excepcionalmente no Auditório do LSE, sala I-044b)
    Título: Inferência Bayesiana em um modelo TRI com distribuição normal assimétrica centralizada para os traços latentes  (Resumo)
  • 29/06 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações"  (no Auditório do LSE, bloco I-044b do CT, às 13:30 horas)  
    • Constantino Tsallis (CBPF)
      Título: Conexões entre sistemas dinâmicos não lineares e entropia quando o máximo expoente de Lyapunov é zero (Resumo)
    • Dani Gamerman (UFRJ)
      Título: Space-time modelling of coupled spatio-temporal environmental variables (Resumo)
  • 15/06 Edilson Fernandes de Arruda (COPPE-UFRJ)
    Título: Processos de Decisão Markovianos: Algoritmos Aproximados e Aceleração de Convergência (Resumo)
  • 25/05 Marco Ferreira (Missouri)
    Título: Dynamic multiscale spatio-temporal models for Gaussian areal data  (Resumo)
  • 18/05 A. Gaudilliere (LATP, Marselha)
    Título: Markovian convergence to equilibrium: the metastable case (Resumo)
  • 04/05 Hugo de la Cruz (IMPA)
    Título: Simulation of stochastic differential equations  (Resumo)
  • 20 /04 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações"  (no Auditório 1, IMPA, às 14:00 horas)  
    • Leonardo T. Rolla (IMPA)
      Título: Métodos gráficos para sistemas de partículas (Resumo)
    • Thaís C. O. Fonseca (UFRJ)
      Título: Modelos espaço-temporais não gaussianos (Resumo)
  • 13/04 Rui Martins (Lisboa)
    Título: Análise conjunta Bayesiana de dados longitudinais e de sobrevivência  (Resumo)
  • 06/04 Emily Fox (Duke)
    Título: Bayesian nonparametric methods for complex dynamical phenomena (Resumo)
  • 23/03 Abel Rodriguez (Santa Cruz, EUA)
    Título: Dirichlet process mixtures  (Resumo)


Resumos das palestras do 1o semestre de 2011

Palestrante:  Caio L. N. Azevedo
Título:  Inferência Bayesiana em um modelo TRI com distribuição normal assimétrica centralizada para os traços latentes
Resumo
Neste trabalho desenvolvemos um algoritmo MCMC para estimar os parâmetros de um modelo TRI com distribuição normal assimétrica centralizada para os traços latentes, proposto por Azevedo, Bolfarine e Andrade (2011). Consideramos uma representação estocástica bastante utilizada para a distribuição normal assimétrica, a fim de facilitar o desenvolvimento e implementação do referido algoritmo. Mecanismos de verificação e validação do modelo são desenvolvidos, também no contexto Bayesiano. Estudos de simulação indicam que o algoritmo desenvolvido estima tão bem ou melhor os parâmetros, em relação ao algoritmo desenvolvido anteriormente por Azevedo, Bolfarine e Andrade (2011), em diversas situações. Além disso, o algoritmo proposto no presente trabalho é mais rápido que seu predecessor. Um conjunto de dados da área educacional é analisado para ilustrar a metodologia, algoritmo de estimação e ferramentas de validação do modelo, desenvolvidos.

Palestrante:  Dani Gamerman
Título:  Space-time modelling of coupled spatio-temporal environmental variables
Resumo
We propose a dynamic factor model for spatio-temporal coupled environmental variables. The model is discussed in a state-space framework which is useful for interpolation and forecast of the variable of interest. The role of the measurement matrix in spatial interpolation is considered and the proposal of its stochastic specification is discussed. Full probabilistic inference for the model parameters is facilitated by Markov chain Monte Carlo (MCMC) algorithms. Standard MCMC for dynamic linear models are adapted to our model specification and predictive results are discussed for two different data sets with variables measured at two different scales.

Palestrante:  Constantino Tsallis
Título:  Conexões entre sistemas dinâmicos não lineares e entropia quando o máximo expoente de Lyapunov é zero
Resumo
Os sistemas dinâmicos não lineares fortemente caoticos se acomodam naturalmente com conceitos tais como a entropia de Boltzmann-Gibbs-Shannon, e consequentemente com a produçao de entropia de Kolmogorov-Sinai, a identidade de Pesin, distribuições Gaussianas, o teorema do limite central, transformada de Fourier, etc. Já o caso dos sistemas fracamente caoticos, mais precisamente cujo maximo expoente de Lyapunov é zero, é bem mais sutil. Faremos uma breve descrição de como uma entropia não aditiva que generaliza a tradicional permite tratar tais sistemas muito satisfatoriamente. Predições, verificações e aplicaçoes em sistemas naturais, artificiais e sociais serão mencionadas também. Alguns problemas abertos que muito beneficiariam de rigor matemático serão apontados.

Palestrante: Edilson Fernandes de Arruda
Título:  Processos de Decisão Markovianos: Algoritmos Aproximados e Aceleração de Convergência
Resumo
Apresentam-se algumas propostas de solução aproximada de processos de decisão markovianos em problemas de grande escala, desenvolvidas em trabalhos com co-autoria do palestrante. Para os casos em que é possível obter a solução exata, é apresentada uma técnica de aceleração de convergência de algoritmos lineares, aplicada ao algoritmo de iteração de valor. A referida técnica pode reduzir consideravelmente o tempo de convergência em relação ao algoritmo tradicional de iteração de valor.

Palestrante: Marco Ferreira
Título:  Dynamic multiscale spatio-temporal models for Gaussian areal data
Resumo
We introduce a new class of dynamic multiscale models for spatio-temporal processes arising from Gaussian areal data. Specifically, we use nested geographical structures to decompose the original process into multiscale coefficients which evolve through time following state-space equations. Our approach naturally accommodates data observed on irregular grids as well as heteroscedasticity. Moreover, we propose a multiscale spatio-temporal clustering algorithm that facilitates estimation of the nested geographical multiscale structure. In addition, we present a singular forward filter backward sampler for efficient Bayesian estimation. Our multiscale spatio-temporal methodology decomposes large data-analysis problems into many smaller components and thus leads to scalable and highly efficient computational procedures. Finally, we illustrate the utility and flexibility of our dynamic multiscale framework through two spatio-temporal applications. The first example considers mortality ratios in the state of Missouri whereas the second example examines agricultural production in Espírito Santo State Brazil.

Palestrante: A. Gaudilliere
Título:  Markovian convergence to equilibrium: the metastable case
Resumo
We will discuss how some mathematical modelization of metastable phenomenology make available new techniques to control relaxation time and mixing time of a large class of slow mixing Markov chains. In particular one can give sharp asymptotics of the spectral gap and control mixing times up to a constant factor by estimating quantities that satisfy a two-sided variational principle. To derive this kind of estimates we extend the notion of quasi-stationary measures to that of soft measures, which interpolate between the usual quasi-stationary measure and the so-called restricted ensemble that appears in the first mathematically rigorous studies of the metastable phenomenon. We also use potential theoretical tools to extend the usual notion of capacity between sets in order to get a new general and practical Poincaré inequality that gives the correct relaxation time asymptotic in "metastable cases".
This talk is based on a joint work with Alessandra Bianchi. 

Palestrante: Thaís C. O. Fonseca
Título:  Modelos espaço-temporais não gaussianos
Resumo
Nesse trabalho construímos processos não gaussianos que possuem função de covariância não separável no espaço-tempo. O modelo não gaussiano é obtido através de misturas na escala, resultando em processos capazes de acomodar tanto observações aberrantes como regiões com variabilidade diferente das demais. Essa flexibilidade é obtida por dois tipos de mistura: um processo que varia suavemente e um outro não correlacionado. Métodos de Monte Carlo por Cadeias de Markov são utilizados para inferência e previsão. Uma aplicação em dados de temperatura na Espanha ilustram o potencial dessa classe de modelos e o ganho no desempenho preditivo.

Palestrante: Leonardo T. Rolla 
Título: Métodos gráficos para sistemas de partículas
Resumo
Consideramos dois tipos de construções gráficas amplamente utilizadas em processos espaciais aleatórios, principalmente sistemas de spin e de partículas interagentes. Começamos pelo chamado ``acoplamento básico'', baseado em pontos de Poisson. Depois descrevemos uma construção baseada em uma rede de agentes distribuídos, onde o sistema é visto como uma seqüência bem comportada de operações ao invés de uma evolução em tempo contínuo. Em seguida vamos discutir algumas aplicações de cada construção em diferentes situações, e finalmente explicar seu uso no estudo de transição de fase em modelos estacionários de criticalidade auto-organizada.

Palestrante: Rui Martins
Título: Análise conjunta Bayesiana de dados longitudinais e de sobrevivência
Resumo
A análise conjunta de dados longitudinais e de sobrevivência tem tido grande atenção nos últimos anos, sobretudo para dados relativo à SIDA. Inicialmente, este tipo de dados era analisado considerando o tempo até ao evento (dados de sobrevivência) e as medidas repetidas (dados longitudinais) de cada indivíduo separadamente. Como ambos os tipos de dados são observados no mesmo indivíduo, a modelação conjunta dos dados longitudinais e de sobrevivência é mais apropriada, porque tem em conta as dependências entre os dois tipos de respostas (Henderson et al. 2000). Guo e Carlin (2004) abordam a questão da análise conjunta propondo um modelo bayesiano hierárquico, cujas estimativas dos parâmetros de interesse são obtidas com base em métodos de Monte Carlo via cadeias de Markov (MCMC). Iremos aqui utilizar a abordagem de Guo e Carlin pra modelar conjuntamente dados longitudinais e de sobrevivência para um grupo de pacientes com VIH/SIDA no Brasil. Além disso, incluiremos efeitos aleatórios espacialmente correlacionados para captar a heterogeneidade não observável entre indivíduos de diferentes estados brasileiros. Concluímos que a análise conjunta bayesiana apresenta consideráveis melhorias na distribuição do tempo de sobrevivência mediano quando comparado com a obtida pelas análises em separado.

Palestrante: Emily Fox
Título: Bayesian Nonparametric Methods for Complex Dynamical Phenomena
Resumo
Background on switching Markov processes
HDPs for hidden Markov modeling with state persistence
                        - application: speaker diarization
HDPs for switching autoregressive and switching linear dynamical processes
                        - applications: honey bees dances, stochastic volatility
Beta processes for jointly modeling multiple time series
                        - background on beta process and Indian buffet process
                        - application: motion capture videos

Palestrante: Abel Rodriguez
Título: Dirichlet process mixtures
Resumo
Motivating examples.
A quick review of finite mixture modeling.
The Dirichlet process mixture model.
Fitting a DP mixture model:  Collapsed samplers.
Examples.
Hyperparameter estimation/ Examples revisited. 



2º semestre de 2010
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 15/12 Hedibert F. Lopes (Chicago)
    Título: Parsimonious Bayesian factor analysis when the number of factors is unknown (Resumo)
  • 17/11 Amy Wu (York, Canadá)
    Título: An M-estimation-based simultaneous change point analysis and variable selection in a regression problem (Resumo)
  • 24/11 Reunião entre Alunos e Corpo Docente
  • 17/11 Nancy Garcia (Unicamp)  (excepcionalmente as 13:30 h)
    Título: Como encontrar o caminho otimo para veiculos autonomos baseados em leituras markovianas (Resumo)
  • 10/11 Flavio Gonçalves (UFJF)
    Título: Exact simulation and Bayesian inference for jump-diffusion processes (Resumo)
  • 27/10 Alexandre Patriota (USP)
    Título: Modelo VAR para testar a causalidade de Granger quando as variáveis envolvidas estão sujeitas a erros de medição (Resumo)
  • 13/10 Eliane Rodrigues (UNAM)
    Título: Alguns modelos de volatilidade estocástica aplicados aos dados de ozônio da rede de monitoramente da Cidade do México (Resumo)
  • 06/10 V. Mandrekar (Michigan)
    Título:  Recurrence properties of solutions in interest rate models (Resumo)
  • 29/09 John W. Emerson (Yale)
    Título: The Bigmemory Project (Resumo)
  • 22/09 Matthieu Lerasle (USP)
    Título: Data-driven penalties in model selection (Resumo)
  • 15/09 Alexander Valencia (USP)
    Título: The radial Brownian web  (Resumo)
  • 08/09 Jim Smith (Warwick) (excepcionalmente as 11:00 h)
    Título: How robust is parametric Bayesian inference? (Resumo)
  • 01/09 Ralph S. Silva (UFMG)
    Título: Auxiliary particle filtering within adaptive Metropolis-Hastings sampling (Resumo)
  • 11/08 Eric Cator (Delft)
    Título: Estimating a monotone regression function  (Resumo)


Resumos das palestras do 2º semestre de 2010  


Palestrante: Hedibert F. Lopes
TítuloParsimonious Bayesian factor analysis when the number of factors is unknown
Resumo
We introduce a new and general set of identifiability conditions for factor models which handles the ordering problem associated with current common practice.  In addition, the new class of parsimonious Bayesian factor analysis leads to a factor loading matrix representation which is an intuitive and easy to implement factor selection scheme.  We argue that the structuring the factor loadings matrix is in concordance with recent trends in applied factor analysis.  Our MCMC scheme for posterior inference makes several improvements over the existing alternatives while outlining various strategies for conditional posterior inference in a factor selection scenario. Four applications, two based on synthetic data and two based on well known real data, are introduced to illustrate the applicability and generality of the new class of parsimonious factor models, as well as to highlight features of the proposed sampling schemes. We want to discuss the advantages of some resampling penalties in a general density estimation framework. We will see how they can be calibrate when the data are independent, or at least mixing. We will also discuss the slope heuristic and justify that it can also be used in a non necessarily independent framework. We obtain for all these methods asymptotically optimal oracle inequalities under a few conditions on the collections of models.  

Palestrante: Amy Wu
Título: An M-estimation-based simultaneous change point analysis and variable selection in a regression problem
Resumo
In this talk, an M-estimation-based criterion is proposed for carrying out change point analysis and variable selection simultaneously in linear models with a possible change point. Under some weak conditions, this criterion is shown to be strongly consistent in the sense that with probability one, it chooses the smallest true model for large sample size. Its byproducts include consistent estimates of the regression coefficients regardless if there is a change point. In case that there is a change point, its byproducts also include a consistent estimate of the change point parameter. In addition, an algorithm is given which has significantly reduced the computation time needed by the proposed criterion for the same precision. Data examples are also presented, which include results from a simulation study and a real data example.
Based on a joint work with Prof. Rao and Mr. Shi. 

Palestrante: Nancy Garcia
TítuloComo encontrar o caminho otimo para veiculos autonomos baseados em leituras markovianas
Resumo
O DARPA Grand Challenge eh uma competicao na qual veiculos autonomos tem que completar uma rota de 300 milhas repleta de obstaculos. Os veiculos tem que completar o trajeto de forma completamente autonoma sem nenhuma influencia externa. Nosso artigo tem como inspiracao este problema, mas trabalha somente em uma pequena parte do
problema. Neste trabalho propomos um algoritmo eficiente para encontrar a trajetoria suave mais curta entre dois pontos evitando obstaculos colocados. Os obstaculos sao medidos atraves de um mecanismo markoviano que
corrige o sensor utilizando a medicao anterior atraves de um filtro de Kalman.

Palestrante: Flavio B. Gonçalves
Título Exact simulation and Bayesian inference for jump-diffusion processes
Resumo
The last 10 years have seen a large increase in statistical methodology for diffusions, and computationally intensive Bayesian methods using data augmentation have been particulary prominent. This activity has been fuelled by existing and emerging applications in economics, biology, genetics, chemistry, physics and engineering. However diffusions have continuous sample paths so may natural continuous time phenomena require more general classes of models. Jump-diffusions have considerable appeal as exible families of stochastic models. Bayesian inference for jump-diffusion models motivates new methodological challenges, in particular requires the construction of novel simulation schemes for use within data augmentation algorithms and within discretely observed data. In this paper we propose a new methodology for exact simulation of jump-diffusion processes. Such method is based on the recently introduced Exact Algorithm for exact simulation of diffusions. We also propose a simulation-based method to make likelihood-based inference for discretely observed jump-diffusions in a Bayesian framework. Simulated examples are presented to illustrate the proposed methodology.

Palestrante: Alexandre Patriota
TítuloModelo VAR para testar a causalidade de Granger quando as variáveis envolvidas estão sujeitas a erros de medição
Resumo
Este estudo apresenta estimadores consistentes para os parâmetros de um modelo autoregressivo vetorial sujeito a erros de medição. A distribuição assintótica dos estimadores é derivada. No caso de dados com erros de medida, os métodos existentes na literatura não podem ser utilizados, pois sob a hipótese nula (não-causalidade de Granger) o modelo se torna não-identificável. Conduzimos estudos de simulação que indicam uma interferência drástica do erro de medição nas conclusões dos testes de hipóteses. O método é aplicado a dados de fMRI (functional magnetic resonance imaging), para detectar os fluxos de informação entre regiões cerebrais.
Trabalho conjunto com João R. Sato (Federal do ABC) e Betsabé G. Blas Achic (UFPE).

Palestrante: Eliane Rodrigues
TítuloAlgunos modelos de volatilidade estocástica aplicados aos dados de ozônio da rede de monitoramente da Cidade do México
Resumo
Apresentaremos alguns modelos bivariados de volatilidade estocástica comumente utilizado no estudo de series de tempo em finanças. Estes modelos serão aplicados às médias semanais de máximos diários de ozônio da Cidade do México. Os modelos serão utilizados para analisar os dados de pares de regiões nas quais a cidade esta dividida. Estes resultados foram obtidos conjuntamente com Jorge. A. Achcar e Henrique C. Zozolotto.

Palestrante: V. Mandrekar
Título Recurrence properties of solutions in interest rate models
Resumo
We show the stability and ultimate boundedness (in mean square sense) of well known financial models for interest rates. As a consequence we derive the existence of invariant measure and recurrence properties of these solutions. The main technique involves the use of Lyapunov function methods developed by R. Khasminskii and Y. Miahara.

 Palestrante: John W. Emerson
Título: The Bigmemory Project
Resumo
Multi-gigabyte data sets challenge and frustrate R users even on well-equipped hard-ware. Use of C/C++ can provide efficiencies, but is cumbersome for interactive data analysis and lacks the flexibility and power of R’s rich statistical programming environment. The package bigmemory and its sister packages biganalytics, synchronicity, and
bigalgebra bridge this gap, implementing massive matrices and supporting their basic manipulation and exploration. The data structures may also be file-backed, allowing users to more easily manage and analyze data sets larger than available RAM and potentially share them across nodes of a cluster. These features of the Bigmemory Project open the
door for powerful and memory-efficient parallel analyses and data mining of massive data sets.

Palestrante: Matthieu Lerasle
TítuloData-driven penalties in model selection
Resumo
In this talk, we want to discuss the advantages of some resampling penalties in a general density estimation framework. We will see how they can be calibrate when the data are independent, or at least mixing. We will also discuss the slope heuristic and justify that it can also be used in a non necessarily independent framework. We obtain for all these methods asymptotically optimal oracle inequalities under a few conditions on the collections of models.
 

Palestrante: Alexander Valencia
TítuloThe radial Brownian web
Resumo
The Brownian Web (BW) is a family of coalescing Brownian motion starting from every point in space time RxR. In this work, we consider a set A of fixed points belonging to circles of radio k, k=1,2,...,n where n is a non negative integer number. Then, we consider a family of coalescing random walks starting from A. After diffusive scaling we obtain the convergence in distribution of this coalescing random walk to what we call "The Radial Brownian Web" on a metric space which is the restriction of the metric space where the "usual" BW takes its values.

Palestrante: Jim Smith
Título: How robust is parametric Bayesian inference?
Resumo
Since MCMC algorithms have been available there has been an explosion of applications using parametric Bayesian statistical models. These of course need prior probabilistic inputs to run, but various ways of setting default priors have been advanced which at least appear to stabilize the numerical algorithms. But to what extent can we believe that the ensuing inferences are reliable and are not too sensitive to the way we initialize this process? In this talk I will demonstrate that however much data we collect there are some aspects of typical Bayesian models we can never learn about. So inference about these quantities just reflects the prior we choose. On the other hand, provided we are careful it is straightforward to demonstrate that, under broad assumptions many types of inference are robust. Indeed simple bounds can be calculated, based on the values of typical summaries calculated from numerical methods which reflect how different inferences would be, given different candidate priors. The talk will be illustrated throughout by familiar examples. This is a joint work with Fabio Rigat and Ali Daneshkhah.  

Palestrante: Ralph S. Silva
TítuloAuxiliary particle filtering within adaptive Metropolis-Hastings Sampling
Resumo
Our article deals with Bayesian inference for a general state space model with the simulated likelihood computed by the particle filter. We show empirically that the partially or fully adapted particle filters can be much more efficient than the standard particle filter, especially when the signal to noise ratio is high. This is especially important because using the particle filter within Markov chain Monte Carlo sampling is O(T2), where T is the sample size. We also show that an adaptive independent Metropolis Hastings proposal for the unknown parameters based on a mixture of normals can be much more efficient than the usual optimal random walk methods because the simulated likelihood is not continuous in the parameters and the cost of constructing a good adaptive proposal is negligible compared to the cost of evaluating the simulated likelihood. Independent Metropolis-Hastings proposals are also attractive because they are easy to run in parallel on multiple processors. The article also shows that the proposed adaptive independent Metropolis Hastings sampler converges to the posterior distribution. We also show that the marginal likelihood of any state space model can be obtained in an efficient and unbiased manner by using the particle filter making model comparison straightforward. Obtaining the marginal likelihood is often difficult using other methods. Finally, we prove that the simulated likelihood obtained by the auxiliary particle filter is unbiased. This result is fundamental to using the particle filter for Markov chain Monte Carlo sampling.

Palestrante: Eric Cator
Título: Estimating a monotone regression function
Resumo
When modeling the effect of a covariate X on a dependent variable Y, in many practical cases it can be natural to assume a monotone relationship between Y and X. In this talk, we will study an estimator that only assumes this monotonicity, and not any other parametric form of the regression function. We will consider the local limit behavior of this non-parametric estimator and present a theorem about its adaptivity and local optimality.   

1º semestre de 2010
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 14/07 Giovani L. Silva (IST, Lisboa)
    Título: Análise espaço-temporal de fogos florestais em Portugal  (Resumo)
  • 16/06 Marcelo Hilário (IMPA)
    Título: Fixação e não conservação em processos de aglomeração distribuida  (Resumo)
  • 02/06 Daniel Y. Takahashi (USP)
    Título: Identifying the interaction graph of an infinite range Ising model  (Resumo)
  • 26/05 Eliane Rodrigues (UNAM) (excepcionalmente na sala B110)
    Título: Modelos Markovianos aplicados a estudos de poluição atmosférica  (Resumo)
  • 12/05 Alexsandro G. G. Gallo (Unicamp)
    Título: Cadeias de alcance variável e esquema regenerativo  (Resumo)

Resumos das palestras do 1º semestre de 2010
 

Palestrante: Giovani L. Silva
Título: Análise espaço-temporal de fogos florestais em Portugal
Resumo
Na última década, os incêndios florestais tornaram-se uma grave catástrofe natural em Portugal. O elevado número de ocorrências de fogos e a sua severidade provocam grande devastação levando a elevados prejuízos, quer económicos quer ambientais, e colocando em risco bens, populações e a subsistência da própria floresta. Neste trabalho apresentam-se modelos hierárquicos bayesianos para analisar dados espaço-temporais relativos à proporção de área ardida em Portugal continental por concelho/municípios ao longo das últimas três décadas. Mistura de distribuições foi usada para modelar conjuntamente a proporção de área ardida e o excesso de concelhos sem área ardida ao longo dos anos em estudo. Na obtenção das estimativas a posteriori dos parâmetros de interesse, usaram-se métodos de Monte Carlo viacadeias de Markov (MCMC).  

Palestrante: Marcelo Hilário
Título: Fixação e não conservação em processos de aglomeração distribuida
Resumo
Consideramos um algoritmo em que, inicialmente, cada sítio da rede Euclidiana Z^d recebe uma quantidade inicial de um dado recurso e, a cada passo, os vértices mais ricos atraem os recursos localizados sobre os seus vizinhos menos ricos. Essa evolução dá origem a um processo de agloremação. Mostraremos que, se a distribuiçãos inicial é invariante por translação, o fluxo ao redor de cada sítio cessa após um número finito de iterações (fixação local). Mostraremos também que existem distribuições iniciais para as quais não se observa conservação de recursos ou seja, para as quais é possível que o recurso que começa em um dado sítio continue se movendo para sempre.

Palestrante: Daniel Y. Takahashi
Título: Identifying the interaction graph of an infinite range Ising model
Resumo
We consider Ising models (binary, pairwise interaction Gibbs probability measures) with an infinite interaction graphs embeded in $\Z^d$. We address the problem of identying pairs of points with non-null interaction based on the values assigned to a finite set of sites in a finite sample of independent realisations of the Ising model. Our main theorem gives an upper bound for the probability of misidentification of interacting pairs of sites. This is a joint work with Antonio Galves and Enza Orlandi.

Palestrante: Eliane Rodrigues
Título: Modelos Markovianos aplicados a estudos de poluição atmosférica
Resumo
Neste seminário vamos apresentar um modelo Markoviano homogêneo no tempo que registra o intervalo onde as medições de ozônio podem pertencer a cada unidade de tempo. Também vamos considerar um modelo não homogêneo no tempo. Neste caso estaremos considerando um modelo de Poisson para contar o número de ultrapasses de uma norma ambiental em um intervalo de tempo de interesse. A estimação dos parâmetros envolvidos nos modelos será realizada sob o ponto de vista Bayesiano. A aplicação dos resultados será feita utilizando dados da rede de monitoramento ambiental da Cidade do México. Este seminário tem como base trabalhos conjuntos com J.A Achcar, L.J. Álvarez, A.A Fernández-Bremauntz e G. Tzinztun.
Palestrante: Alexsandro G. G. Gallo
Título: Cadeias de alcance variável e esquema regenerativo
Resumo
Uma primeira (grande) parte da palestra será dedicada à introdução das cadeias de Markov de alcance variável. Estas cadeias têm a propriedade de que a cada tempo, o estado escolhido depende de um sufixo do passado, cujo tamanho (limitado) é uma função determinística do passado. Isso contrasta com a situação nas cadeias de Markov genéricas, em que o alcance é fixo.
Este modelo foi introduzido em 1983 por Jorma Rissanen para compressão de dados, e foi (re-)descoberto recentemente como uma ferramenta poderosa para modelagem estocástica em áreas muito diversas, tais como linguística ou biologia, por exemplo.
A segunda parte será dedicada às cadeias de alcance variável não limitado. Mostraremos que sob certas condições, estas cadeias, que são "não-markovianas" podem exibir um esquema regenerativo.

2º semestre de 2009
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 09/12 Valentin Sisko (UFF)
    Título: Medidas de Gibbs sobre um conjunto de grafos infinitos  (Resumo)
  • 24/11 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações"  (excepcionalmente na 3a feira no Auditório 1, IMPA, às 14:30 horas)  
    • Marzio Cassandro  (Roma)
      Título: Coarse graining in Statistical Mechanics and Kac models (Resumo)
    • Helio S. Migon (UFRJ)
      Título: Objective Bayesian Analysis for Heteroscedastic Regression (Resumo)
  • 18/11 José M. Bernardo (Valencia)
    Título: An objective  Bayesian approach to natural induction  (Resumo)
  • 30/10 Dalton F. Andrade (UFSC) (excepcionalmente na 6a. feira às 15hs.)
    Título: Teoria da Resposta ao Item: principais conceitos e suas aplicações em diferentes áreas (Resumo)
  • 14/10 Carlos A. Abanto-Valle (UFRJ)
    Título: Bayesian analysis of heavy-tailed stochastic volatility in mean model using scale mixtures of normal distributions (Resumo)
  • 30/09 Reunião entre Alunos e Corpo Docente
  • 23/09 Leandro Pimentel (UFRJ)
    Título: A conjectura da raiz cúbica (ou conjectura KPZ) para o máximo entre somas de variáveis aleatórias
  • 02/09 Apresentações Prévias de Mestrado*
    13:30 Palestrante: Kelly Cristina Mota Gonçalves
    Título: Estimadores Lineares Bayesianos em População Finita
    14:00 Palestrante: Larissa de Carvalho Alves
    Título: Incorporando distâncias econômicas em modelos dinâmicos bayesianos
    14:30 Palestrante: Leonardo Nassif
    Título: Modelos dinâmicos matriz variados com estrutura de grafos para construcão e otimizacão de portfólios
    15:30 Palestrante: João Batista de Morais Pereira
    Título: Métodos de estimação em modelos dinâmicos para séries temporais de contagens
    16:00 Palestrante: Thiago Guerrera Martins
    Título: Aproximações Analíticas de Distribuições a Posteriori
    16:30 Palestrante: Rodrigo Targino
    Título: Aplicações do Movimento Browniano Fracionário em Finanças
    * - Cada apresentação terá duração de 20 minutos seguida de 10 minutos de arguição. Elas ficarão divididas em 2 blocos com intervalo de 15:00 às 15:30 hs entre eles.
  • 19/08 Milton Jara (Paris)
    Título: Sistemas de partículas em ambiente aleatório (Resumo)
  • 12/08 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações"  (excepcionalmente no CBPF, às 13:30 horas)  
    • Mucio A. Continentino (CBPF)
      Título: Transições de fase quânticas
    • Itzhak Roditi (CBPF)
      Título: Diferentes abordagens em campos quânticos a temperatura finita

Resumos das Palestras do 2º semestre de 2009
 

Palestrante: Valentin Sisko
Título: Medidas de Gibbs sobre um conjunto de grafos infinitos
Resumo
Seja $\Gamma$ um subconjunto de $\mathbb{R}^d$ localmente finito e seja $(\Gamma,E)$ o grafo completo. Consideramos medidas de Gibbs sobre o conjunto de todos subgrafos $(\Gamma,E')$ tais que o conjunto de elos $E'$ é subconjunto de $E$. A interação de Gibbs atua entre cada dois elos presentes tais que eles têm um vértice em comum. Estudamos propriedades de percolação em relação à medida de Gibbs em dois casos: a) quando $\Gamma$ é uma realização de um processo de Poisson em $\mathbb{R}^d$. b) quando $\Gamma$ tem decaimento exponencial de conectividade. Trabalho em colaboração com Pablo A. Ferrari, Eugene A. Pechersky e Anatoli A. Yambartsev.

Palestrante: Helio S. Migon
Título: Objective Bayesian Analysis for Heteroscedastic Regression
Resumo
The normality assumption is very common in many statistical problems, but in some cases unatenable for natural phenomena due to the distribution of the data shows a leptokurtic or a platykurtic shape and is not robust to outliers. In order to accommodate this characteristic we propose the use of t-Student, which reduces the influence of outliers. Another choice is the exponential power (EP) distribution that can provide both heavier (leptokurtic) and lighter tails (platykurtic) than normal density.
Objective Bayesian analysis for linear heteroscedastic regression models is developed. We derive explicit expressions for Jeffreys priors for the model parameters and show that some of these priors lead to proper posterior distributions. Moreover, we show that our proposed Bayesian analysis compares favorably to frequentist analysis previously proposed in the literature. Finally, we illustrate our methodology with applications of the Student-t and exponential power regression models to different datasets.

Palestrante: Marzio Cassandro
Título: Coarse graining in Statistical Mechanics and Kac models
Resumo
The coarse graining technique is a mathematical device to describe the actual procedure to perform a measure in a physical system with a very large number of degrees of freedom. We discuss its relevance in Equilibrium Statistical Mechanics and illustrate the application to a class of systems with long range interactions: the Kac models.

Palestrante: Dalton F. Andrade
Título: Teoria da Resposta ao Item: principais conceitos e suas aplicações em diferentes áreas
Resumo
Neste seminário serão apresentados e discutidos os principais conceitos da Teoria da Resposta ao Item, procurando mostrá-la como uma poderosa ferramenta na construção e interpretação de escalas de medida. Serão apresentados seus diversos modelos e os principais métodos de estimação dos parâmetros envolvidos. Diversos exemplos com dados reais serão apresentados, bem como tópicos de pesquisas em andamento ou para pesquisas futuras.

Palestrante: Carlos A. Abanto-Valle
Título: Bayesian analysis of heavy-tailed stochastic volatility in mean model using scale mixtures of normal distributions
Resumo
The stochastic volatility in mean (SVM) model using the class of symmetric scale mixtures of normal (SMN) distributions is introduced. The SMN distributions provide a robust alternative in the absence of normality. Specific distributions examined include the normal, Student-t, slash, variance gamma and contaminated normal. Using a Bayesian viewpoint, an efficient method based on Markov chain Monte Carlo (MCMC) is developed for parameter estimation. The methods developed are applied to analyze daily stock returns data on São Paulo Stock, Mercantile & Futures Exchange index (IBOVESPA). Bayesian model selection criteria as well as out-of- sample forecasting results reveal that the SVM model with Slash distribution provides significant improvement in model fit as well as prediction to the IBOVESPA data over the usual normal model. This is joint work with Helio Migon and Victor Lachos.

Palestrante: Leandro Pimentel
Título: A conjectura da raiz cúbica (ou conjectura KPZ) para o máximo entre somas de variáveis aleatórias
Resumo
Neste seminário iremos discutir o seguinte problema fundamental em teoria das probabilidades e estatística. Suponha que { X_i : i em I } seja uma coleção de variáveis aleatórias i.i.d. de tamanho n. O resultado chave para a análise estatística do funcional S_I = \sum_{i em I} X_i é o Teorema do Limite Central, a saber: na escala n1/2, a distribuicao de S_I − E(S_I) pode ser aproximada por uma curva gaussiana. Outro tipo de funcional sobre variáveis aleatórias surge naturalmente na seguinte situação não muito distinta: suponha que seja dado uma família de conjuntos I e que, para cada conjunto I em I, haja também { X_i : i em I } como anteriormente. Nesse modelo, o funcional é dado pelo máximo entre todas as somas possiveis: LI = max_{ I em I} S_I . A conjectura da raiz cúbica (postulada pelos físicos Kadar, Parisi e Zhang) afirma que, para certos modelos de percolação onde I é uma determinada classe de caminhos sobre grafos orientados, a escala correta para a análise estatística de L_I − E(L_I) é n^{1/3}, onde n ~ max_{ I em I} |I|, independentemente dos detalhes microscópicos do modelo. Também se espera que a curva limite da distribuição seja algo envolvendo o determinate de Fredholm do núcleo de Airy.

Palestrante: Milton Jara
Título: Sistemas de partículas em ambiente aleatório
Resumo
We obtain some scaling limits for particle systems in random environment. Examples of such scaling limits are hydrodynamic limits, density fluctuations and asymptotics of a tagged particle. Those limits are descibed in terms of a differential operator L^W which in its general form is random, reflecting the influence of the environment in the
collective behavior of the system.


1º semestre de 2009
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 29/06 Ralph S. Silva (Sydney) (excepcionalmente na 2ª feira)
    Título: A copula based approach to adaptive sampling (Resumo)
  • 24/06 Claudio Landim (IMPA)
    Título: Medida estacionárias fora do equilíbrio (Resumo)
  • 27/05 Alan Gelfand (Duke)
    Título: Fusing point and areal level space-time data with application to wet deposition (Resumo)
  • 20/05 Luigi Ippoliti (Pescara)
    Título: Supervised classification of functional infrared imaging data for differential diagnosis of Raynaud´s phenomenon (Resumo)
  • 13/05 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações"  (excepcionalmente na sala G-122 do CT, às 13:30 horas)  
    • Paulo M. C. Oliveira (UFF)
      Título: Evolução das linguagens faladas (Resumo)
    • Marcelo Viana (IMPA)
      Título: Sistemas determinísticos - uma perspectiva estocástica (Resumo)
  • 29/04 Lelys Guenni (Caracas)
    Título: Detection of oceanic influence on the precipitation of the central Venezuelan coast using time-varying models (Resumo)
  • 01/04 Claudia Klueppelberg (Munique) (excepcionalmente as 13:30 h)
    Título: Estimating high quantiles for electricity prices by stable linear models (Resumo)
  • 25/03 Paulo S. Lucio (UFRN)
    Título: Uma alternativa computacional-Bayesiana para a recuperação de informação demográfica via algoritmo “EM”   (Resumo)
  • 18/03 Reunião entre Alunos e Corpo Docente
  • 06/03 Abertura do Ciclo de Palestras de 2009 (excepcionalmente às 15:00 horas)
    • 15:00 Anthony Davison (Lausanne)
      Título: Geostatistics of extremes (Resumo)
    • 16:00 Peter J. Green (Bristol)
      Título: Bayesian model-based clustering procedures and application to gene expression profiles  (Resumo)

Resumos das Palestras do 1º semestre de 2009
 

Palestrante: Ralph Silva
Título: A copula based approach to adaptive sampling
Resumo
Our article is concerned with adaptive sampling schemes for Bayesian inference that update the proposal densities using previous iterates. We introduce a copula based proposal density which is made more efficient by combining it with antithetic variable sampling. We compare the copula based proposal to an adaptive proposal density based on a multivariate mixture of normals and an adaptive random walk Metropolis proposal. We also introduce a refinement of the random walk proposal which performs better for multimodal target distributions. We compare the sampling schemes using challenging but realistic models and priors applied to real data examples. The results show that for the examples studied, the adaptive independent Metropolis-Hastings proposals are much more efficient than the adaptive random walk proposals and that in general the copula based proposal has the best acceptance rates and lowest inefficiencies.
This is joint work with Robert Kohn, Paolo Giordani and Xiuyan Mun.

Palestrante: Claudio Landim
Título: Medida estacionárias fora do equilíbrio
Resumo
Propomos uma teoria termodinâmica para estados estacionários fora do equilíbrio examinando sistemas de partículas em contato com reservatórios.

Palestrante: Alan Gelfand
Título: Fusing point and areal level space-time data with application to wet deposition
Resumo
Motivated by the problem of predicting annual wet chemical deposition in the eastern United States, this paper develops a framework for joint modeling of point and grid referenced spatio-temporal data in this context. The proposed hierarchical model is able to provide accurate spatial interpolation and temporal aggregation by combining information from observed point referenced monitoring data and gridded output from a numerical simulation model known as the Community Multi-scale Air Quality (CMAQ) model. The technique avoids the change of support problem which arises in other hierarchical models for data fusion settings to combine point and grid referenced data. The hierarchical space-time model is fitted to weekly wet sulfate and nitrate deposition data over the eastern United States. The model is validated with set-aside data from a number of monitoring sites. Predictive Bayesian methods are developed and illustrated for inference on aggregated summaries such as quarterly and annual deposition maps.
This is joint work with Sujit K. SAHU and David M. HOLLAND.

Palestrante: Luigi Ippoliti
Título: Supervised classification of functional infrared imaging data for differential diagnosis of Raynaud´s phenomenon
Resumo
This work proposes a supervised classification approach for the differential diagnosis of Raynaud’s phenomenon on the basis of functional infrared imaging data. The classification of data from healthy subjects and from patients suffering for primary and secondary Raynaud’s Phenomenon was first attempted by means of linear discriminant analysis (LDA). Since direct application of LDA on raw data does not lead to satisfactory results, we shall show that a substantial improvement of the classification can be achieved by addressing the problem of feature extraction by means of functional variables and shape measures. The results of the proposed methodology are shown and discussed for a data set of 29 subjects.
This is joint work with Simone Di Zio.

Palestrante: Marcelo Viana
Título: Sistemas determinísticos - uma perspectiva estocástica
Resumo
A evolução de grande parte dos fenômenos naturais é descrita por modelos matemáticos determinísticos, tais como equações diferenciais, iteração de transformações ou equaçoes diferenciais parciais de evolução.
No entanto, diversos avanços realizados no século XX levaram à descoberta de que a compreensão e previsão do comportamento assintótico de tais fenômenos frequentemente exige uma abordagem de natureza estocástica.
Faremos uma apresentação auto-contida das principais idéias que constituem esta teoria e de alguns resultados recentes.

Palestrante: Paulo M. C. Oliveira
Título: Evolução das linguagens faladas
Resumo
As línguas faladas pelo homem evoluem, uma dando origem a outras novas. Linguistas são capazes de medir a distância entre duas línguas atuais. Quanto maior for tal distância, mais remota no tempo estará a língua passada ancestral comum às duas atuais. Assim, as idades das línguas atuais e ancestrais podem ser inferidas, e famílias de línguas são definidas, apenas com o conhecimento das línguas atuais. É um trabalho de reconstrução histórica do passado, da frente para trás, como fazem os geneticistas e biólogos.
Construimos um modelo computacional de árvore muito simples, em que cada língua sofre constantemente mutações e às vezes se bifurca em duas. Num determinado instante da evolução dessa árvore, podemos medir distâncias entre pares de línguas, e daí inferir idades e definir famílias, da frente para trás como os linguistas. Na simulação, porém, podemos fazer o que os linguistas não podem: seguir toda a história das bifurcações, de trás para frente, e comparar o resultado real com o inferido.
Os dados reais disponíveis são o número de falantes de cada língua atual, e as línguas pertencentes a cada família. Com tais dados, construimos a distribuição de línguas de acordo com o tamanho das populações falantes, bem como a distribuição de famílias de acordo com seu tamanho (número de línguas pertencentes à mesma família). Os resultados de nossas simulações reproduzem perfeitamente a realidade. Um resultado interessante é que a taxa de mutação é a mesma para todas as línguas, independente das populações de falantes, indicando ser essa evolução uma característica do ser humano e não da sociedade.

Palestrante: Lelys Guenni
Título: Detection of oceanic influence on the precipitation of the central Venezuelan coast using time-varying models
Resumo
Exceptional rainfall events occurred during mid-December 1999 produced floods and landslides along the north central coast of Venezuela with over 10,000 fatalities reported and economic looses estimated at over 1.8 million (Lyon, 2003). Similar events occurred also in February, 1951 and February 2005. Wieczorek et al. (2001) also reported that many of these severe events documented in the region have occurred during the period November-February. Common features of the combined anomalies in the Equatorial Pacific and the North Tropical Atlantic sea surface temperature (SST) were found for most of the extreme rainfall events. The aim of the analysis is to detect potential changes in mean daily precipitation and monthly daily maxima during the November-February months. Dependencies of extremes and mean daily values on the oceanic features are analyzed using time varying models. To explore changes in mean daily rainfall dependence on the SST anomalies, a normal distribution for the cubic root of mean daily rainfall with a temporal component defined through a Dynamic Linear model (DLM) or state space representation was used. On another hand, a non-stationary Generalized Extreme Value (GEV) model with a time-varying dependence of the location parameter on the oceanic anomalies, was used to evaluate monthly daily maxima changes with time. A more clear signal of change is observed for the extreme values than for the mean values, which agrees with the potential rainfall changes projected under climate change.
This is joint work with Gabriel Huerta (University of New Mexico) and Bruno Sansó (University of California at Santa Cruz)

Palestrante: Claudia Klueppelberg
Título: Estimating high quantiles for electricity prices by stable linear models
Resumo
We estimate conditional and unconditional high quantiles for daily electricity spot prices based on a linear model with stable innovations. This approach captures the impressive  peaks in such data and, as a four-parametric family captures also the assymmetry in the innovations. Moreover, it allows for explicit formulas of quantiles, which can then be calculated recursively from day to day. We also prove that conditional quantiles of step $h\in\bbn$ converge for $h\to\infty$ to the corresponding unconditional quantiles. The paper is motivated by the daily spot prices from the Singapore New Electricity Market, which serves an example to  show our method at work.
This is joint work with Christine Bernhardt and Thilo Meyer-Brandis.

Palestrante: Paulo S. Lucio
Título: Uma alternativa computacional-Bayesiana para a recuperação de informação demográfica via algoritmo “EM”
Resumo
Um dos grandes problemas enfrentados por Sistemas de Informação de Saúde é a ocorrência de subnotificações de nascimentos e óbitos (e doenças), que ainda hoje em algumas regiões do país, como a Norte e a Nordeste, são preocupantes.  Outro fator limitativo é a existência de um número razoável de nascimentos que somente são registrados em anos posteriores (registro atrasado de nascimento).  Estes problemas trazem como conseqüência,
imprecisões nas estimativas, diminuindo/ou aumentando, sobremaneira, as taxas de mortalidade (ou incidência de doenças), não porque a área tenha realmente menor/ou maior risco, e sim pelo fato dos óbitos e/ou nascimentos
(ou doenças) não serem registrados na sua totalidade. Acrescida a esta problemática, depara-se, em vários municípios brasileiros, com elevado número de óbitos por causas desconhecidas ou mal-definidas, as quais passam a ocupar lugar de destaque dentre as principais causas de morte, não refletindo a realidade dos padrões de mortalidade desses municípios. Assim, este seminário tem como objetivo apresentar uma alternativa para inferir sobre os números de casos (nascimentos, óbitos ou doenças) em uma determinada população, a partir de uma amostra com dados incompletos. Nesse intuito, e com este propósito, será apresentado de forma suscinta o algoritmo EM, ("Expectation Maximization") bastante citado na literatura bayesiana contemporânea. Uma forma particular deste algoritmo é obtida quando a distribuição de referência pode ser expressa como casos especiais pertencente à família exponencial generalizada. Após simular a população, será coletada uma amostra, no qual será obtida uma estimativa do verdadeiro número de casos ou ocorrências, em seguida, será empregado um método de reamostragem Bootstrap, com a finalidade de medir a variabilidade e o erro Monte Carlo e, a partir deste, criar intervalos de credibilidade para o parâmetro de interesse, implementando todas as simulações com o software estatístico R.

Palestrante: Anthony Davison
Título: Geostatistics of extremes
Resumo
Climatic change is forecast to change the frequency and sizes of extreme events such as major storms, heatwaves and the like, and the effects on human mortality, health and infrastructure are starting to become of major concern to public health authorities, engineers, and other planners. Predicting the possible impacts of such events necessarily entails extrapolation outside the range of the available data, and the usual basis for this is the statistics of extremes and its underlying probability models. Analysis of extreme events for single series of data is now well-established and used in a variety of disciplines, from hydrology through metallurgy to finance and insurance, but the corresponding theory for events in space is underdeveloped.  After some motivating material, this talk will describe the basic probabilistic theory of extremes, and then will outline how it may be extended to the spatial context, before turning to more statistical matters such as fitting of appropriate models to data and their use for prediction of future events.

Palestrante: Peter J. Green
Título: Bayesian model-based clustering procedures and application to gene expression profiles
Resumo
We present a general framework for Bayesian model-based clustering, in which subset labels are exchangeable, and items are also exchangeable, possibly up to covariate effects. It is rich enough to encompass a variety of existing procedures, including some recently discussed methodologies involving stochastic search or hierarchical clustering, but more importantly allows the formulation of clustering procedures that are optimal with respect to a specified loss function. Our focus is on loss functions based on pairwise coincidences, that is, whether pairs of items are clustered into the same subset or not.
We go on to discuss a Bayesian mixture model that allows us to express a gene expression profile across different experimental conditions as a linear combination of covariates characterising those conditions, plus error. In a standard Bayesian nonparametric formulation, the regression coefficients of the linear combination and the error precisions would jointly follow a Dirichlet process (DP). In this set-up the clusters generated by the process are a priori exchangeable. However in the gene expression context, it commonly occurs that some genes are not influenced by the covariates, but fall into a `background' class. This calls for an extension to the DP model generating a background cluster that is not exchangeable with the others.
This is joint work with Dr John Lau, now at University of Western Australia.


2º semestre de 2008
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 10/12 Encerramento do Ciclo de Palestras de 2008 (excepcionalmente às 14:00 horas)
    • Leonardo S. Bastos (Sheffield)
      Título: Validating Gaussian process emulators  (Resumo)
    • Thais C. O. Fonseca (Warwick)
      Título: Bastos (Sheffield)
      Título: Nongaussian spatiotemporal modeling  (Resumo)
  • 17/11 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente no CBPF, Auditório do 6o andar às 14:30 horas)
    • Nestor Caticha (IF/USP)
      Título: Inferencia, probabilidade e entropia (Resumo)
    • Carla Goldman (IF/USP)
      Título: O transporte mediado por motores moleculares e os processos de exclusao assimetricos (Resumo)
  • 12/11 Silvia Ferrari (USP)
    Título: Improved likelihood inference in beta regression (Resumo)
  • 22/10 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente às 13:30 horas)
    • Francisco Cribari (UFPE)
      Título: Nearly unbiased inference under heteroskedasticity of unknown form (Resumo)
    • Marcia D. Branco (USP)
      Título: Inferência Bayesiana em modelos assimétricos (Resumo)
  • 08/10 Cibele Queiroz da Silva (UnB)
    Título: Bayesian capture-recapture analysis: an application in modeling semelparity of a neotropical didelphid marsupial (Resumo)
  • 23/09 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente no LNCC, Auditório A às 13:30 horas)
    • Elder M. Hemerly (ITA)
      Título: Filtro de Kalman: Introdução e Aplicações em Sistemas de Navegação (Resumo)
    • Marcelo G. S. Bruno (ITA)
      Título: Filtros de Partículas e suas Aplicações em Processamento de Sinais (Resumo)
  • 17/09 Apresentações Prévias de Mestrado*
    13:30 Palestrante: Patricia Lusie Coelho Velozo
    Título: Modelos para Dados Categóricos com Estrutura Temporal
    14:00 Palestrante: Josiane da Silva Cordeiro
    Título: Estimação de Parâmetros que definem Modelos Determinísticos
    14:30 Palestrante: Mariana Albi de Oliveira Souza
    Título: Algoritmos para Maximização da Utilidade Esperada
    15:30 Palestrante: Nícia Custódio Hansen
    Título: Modelos com Coeficientes Dinâmicos Variando no Espaço: Uma Aplicação para Dados de Contagem
    16:00 Palestrante: Vera Lúcia Filgueira dos Santos
    Título: Teoria de Resposta ao Item: uma abordagem generalizada das Curvas Características dos Itens
    16:30 Palestrante: Denise Reis Costa
    Título: Metodologia estatística para construção de testes adaptativos informatizados
    * - Cada apresentação terá duração de 20 minutos seguida de 10 minutos de arguição. Elas ficarão divididas em 2 blocos com intervalo de 15:00 às 15:30 hs entre eles.
  • 03/09 Marcel T. Vieira (UFJF)
    Título: Covariance Structure Models for Longitudinal Complex Survey Data (Resumo)
  • 20/08 Flavio B. Gonçalves (Warwick)
    Título: Simulação exata e inferência em processos de difusão (Resumo)
  • 13/08 Marco A. R. Ferreira (Missouri/UFRJ)
    Título: Gaussian multiscale spatio-temporal models (Resumo)
  • 06/08 Hedibert F. Lopes (Chicago)*
    Título: Particle learning and smoothing (Resumo)
    * - o Prof. Hedibert ministrará um tutorial introdutório sobre Monte Carlo sequencial de 13 as 15 horas.

Resumos das Palestras do 2º semestre de 2008
 

Palestrante: Leonardo S. Bastos
Título:
Validating Gaussian process emulators
Resumo
In this talk, I am going to give a brief introduction of complex Computer models, also known as simulators, that are widely used in all areas of science and technology to represent complex real-world phenomena. Simulators are often sufficiently complex that they take appreciable amounts of computer time or other resources to run. In this context, a methodology has been developed based on building a statistical representation of the simulator, known as an emulator. The principal approach to building emulators uses Gaussian processes. I am going to present a set of diagnostics to validate and assess the adequacy of a Gaussian process emulator as surrogate for the simulator. These diagnostics are based on comparisons between simulator outputs and Gaussian process emulator outputs for some test data, known as validation data, defined by a sample of simulator runs not used to build the emulator. Our diagnostics take care to account for correlation between the validation data.  

 

Palestrante: Thais C. O. Fonseca
Título:
Nongaussian spatiotemporal modeling
Resumo
In this work, we develop and study nongaussian models for processes that vary continuously in space and time. The main goal is to consider heavy tailed processes that can accommodate both aberrant observations and clustered regions with larger observational variability. These situations are quite common in meteorological applications where outliers are associated with severe weather events such as tornados and hurricanes. In this context, the idea of scale mixing a gaussian process as proposed in Palacios and Steel (JASA, 2006) is extended and the properties of the resulting process are discussed. The model is very flexible and it is able to capture variability across time that differs according to spatial locations and variability across space that differs in time. This is illustrated by an application to maximum temperature data in the Spanish Basque Country. The model allows for prediction in space-time since we can easily predict the mixing process and conditional on the latter the finite dimensional distributions are gaussian. The predictive ability is measured through proper scoring rules such as log predictive scores and interval scores. In addition, we explore the performance of the proposed model under departures from gaussianity in a simulated study where data sets were contaminated by outliers in several ways; overall, the nongaussian models recover the covariance structure well whereas the covariance structure estimated by the gaussian model is very influenced by the contamination.  

 

Palestrante: Nelson Caticha
Título:
Inferencia, probabilidade e entropia
Resumo
Este colóquio trata de inferência indutiva, ou seja, o problema de lidar de forma racional com casos em que há informação incompleta. Como quantificar que uma asserção é mais plausível que outra?Como evitar algumas inconsistências de raciocínio?A tentativa de extensão da lógica Aristotélica para situações em que não há informação completa levou Cox nos anos 40a se perguntar qual seria a estrutura matemática adequada para lidar de forma racional com estes casos. Não é uma surpresa que a estrutura matemática adequada seja a teoria de probabilidades. A surpresa está em que isso possa ser deduzido. Inferência se reduz agora ao problema de atribuir probabilidades com base na informação e às mudanças decorrentes da aquisição de nova informação. Existe uma forma geral de realizar inferência que satisfaça certos requisitos básicos? A imposição do resultado em alguns casos simples leva ao método geral de máxima entropia. Inferência pode ser interpretada de um ponto de vista geométrico. Após a apresentação simplificada dos resultados acima serão mostradas algumas aplicações a problemas de aprendizado e análise de dados.

Palestrante: Carla Goldman
Título:
O transporte mediado por motores moleculares e os processos de exclusao assimetricos
Resumo
Motores moleculares, em particular as kinesinas e dineínas, são proteínas capazes de realizar transporte ativo de objetos como organelas, vesículas, vírus, etc em ambiente celular, ao longo de micro-túbulos ou filamentos, onde as forças viscosas têm papel predominante e, portanto, determinam o caráter estocástico do processo nas escalas microscópicas. O “modelo padrão” proposto no início dos anos 90 por Adjari, Astumian, Prost e Magnhasco, prevê propriedades do movimento executado por estas proteínas nestas escalas, que vão de encontro aos dados experimentais da época, obtidos a partir da observação de um único motor. Surpreendentemente, experimentos mais recentes, obtidos de sistemas in vivo, indicam que o movimento das partículas transportadas, referidas como “carga” - não acompanha, necessariamente, o movimento previsto e observado dos motores, quando analisados individualmente. Em particular, observa-se que a “carga” muda de sentido diversas vezes antes de atingir seu destino final, em um movimento não-difusivo, denominado bidirecional, que pode ser caracterizado na melhor das hipóteses, por grandes flutuações de sentido. Desde então, diversas possibilidades tem sido apontadas para as causas deste movimento bidirecional. Há consenso, no entanto, em torno da idéia de que seja devido a um efeito coletivo dos motores. O que ainda necessita resposta é a natureza deste tipo de efeito e como identificá-lo por meio a uma descrição mais analítica destes sistemas. Neste colóquio, faremos uma breve revisão do “modelo padrão” e das discussões existentes na literatura a respeito da caracterização de tal efeito coletivo. Em seguida, mostraremos como é possível a descrição de propriedades destes sistemas, vistos como sistemas de partículas, por meio de um da análise de um modelo que descreve um processo de exclusão assimétrico (ASEP). Este modelo foi proposto por nós recentemente para incluir as partículas motoras em interação com partículas “escravas”, identificadas como a “carga”. O modelo apresenta uma transição de fase do tipo condensação que, como mostraremos, pode ser explorada como alternativa para a compreensão do movimento bidirecional mencionado.

Palestrante: Silvia Ferrari
Título:
Improved likelihood inference in beta regression
Resumo
We consider the issue of performing accurate small-sample likelihood-based inference in beta regression models, which are useful for modeling continuous proportions that are affected by independent variables. We derive Skovgaard's (Scandinavian Journal of Statistics, 28 (2001) 3-32) adjusted likelihood ratio statistic in this class of models. We show that the adjustment term has a simple compact form that can be easily implemented from standard statistical software. We present Monte Carlo simulations showing that inference based on the adjusted statistic we propose is more reliable than that based on the usual likelihood ratio statistic.

Palestrante: Marcia D. Branco
Título:
Inferência Bayesiana em modelos assimétricos
Resumo
Nos últimos anos novas classes de distribuições de probabilidade multivariadas e não simétricas tem sido propostas na literatura.  O principal interesse é fornecer uma alternativa à suposição de normalidade usualmente considerada na modelagem estatística. Essa alternativa deve acomodar diferentes assimetrias, curtoses e eventualmente multimodalidade. Além disso, essas distribuições de probabilidade devem possibilitar algum tipo de tratamento analítico de modo a facilitar a inferência estatística. As distribuições assimétricas induzidas por processos de seleção, discutidas
em Arellano, Branco e Genton (2006) têm as características descritas anteriormente.  Nesta apresentação discutiremos algumas dessas distribuições de probabilidades, tais como, normal-assimétrica e t-assimétrica. Aplicações envolvendo modelos lineares mistos e modelos binários serão apresentadas. A abordagem de inferência considerada para todas as aplicações será a bayesiana, com destaque para o uso de distribuições a priori objetivas.
 

Palestrante: Francisco Cribari
Título:
Nearly unbiased inference under heteroskedasticity of unknown form
Resumo
The linear regression model is commonly used by practitioners to model the relationship between the variable of interest and a set of explanatory variables. The assumption that all error variances are the same, known as homoskedasticity, is oftentimes violated when cross sectional data are used. Consistent standard errors for the ordinary least squares estimators of the regression parameters can be computed following the approach proposed by White (1980). Such standard errors, however, are considerably biased in samples of typical sizes. An improved covariance matrix estimator was proposed by Qian and Wang (2001). We improve upon the Qian-Wang estimator by defining a sequence of bias adjusted estimators with increasing accuracy. The numerical results reveal that the Qian-Wang estimator is typically much less biased than the estimator proposed by Halbert White and that our correction to the former can be quite effective in small samples. Finally, we show that the Qian-Wang estimator can be generalized into a broad class of heteroskedasticity-consistent covariance matrix estimators, and our results can be easily extended to such a class of estimators.
 

Palestrante: Cibele Q. Silva
Título:
Bayesian capture-recapture analysis: an application in modeling semelparity of a neotropical didelphid marsupial
Resumo
We develop a series of Bayesian statistical models for estimating survival of a neotropic didelphid marsupial, the Brazilian gracile mouse opossum (Gracilinanus microtarsus). These models are based on the Cormack-Jolly-Seber model (Cormack, 1964; Jolly, 1965; Seber, 1965) with both survival and recapture rates expressed as a function of covariates using a logit link. The proposed models allow taking into account heterogeneity in capture probability caused by the existence of different groups of individuals in the population. The models were applied to two cohorts (Cohort 2000 and Cohort 2001) with the first one including 14 and the second one 15 sampling occasions. The best models for each of the cohorts indicate that it G. microtarsus is best described as partially semelparous, a condition in which mortality after the first mating is high but graded over time, with a fraction of males surviving for a second breeding season (Boonstra, 2005).

Palestrante: Marcelo G. S. Bruno
Título:
Filtros de Partículas e suas Aplicações em Processamento de Sinais
Resumo
Métodos Monte Carlo sequenciais também conhecidos como filtros de partículas têm recebido crescente atenção recentemente como um método alternativo para aproximar a solução de mínimo erro quadrático médio do problema de inferência recursiva de estados ocultos em sistemas dinâmicos não-lineares e não-gaussianos. Ao contrário de métodos paramétricos como o filtro estendido de Kalman (EKF), os algoritmos de filtragem de partículas não buscam representar a distribuição a posteriori das variáveis ocultas por expressões analíticas fechadas. Ao invés disso, busca-se construir a cada instante um conjunto apropriadamente ponderado de amostras aleatórias (ou "partículas") tal que, à medida que o número de amostras cresce, sua média ponderada aproxima a esperança das variáveis de estado condicionada às observações. Esse conjunto apropriado de amostras e os seus respectivos pesos são atualizados recursivamente usando o modelo em espaço de estados subjacente ao problema de inferência que se deseja resolver. Neste seminário, apresenta-se o conceito de amostragem por importância sequencial no qual se baseiam os filtros de partículas e discutem-se técnicas usuais de otimização de filtros de partículas encontradas na literatura. A seguir, examina-se o problema de estimação por filtros de partículas de variáveis de estado ocultas em sistemas dinâmicos com parâmetros aleatórios desconhecidos. O problema em discussão é ilustrado no contexto de aplicações específicas desenvolvidas pelo ITA nas áreas de equalização cega de canais de comunicação seletivos em frequência e rastreamento de alvos balísticos no estágio de reentrada da atmosfera. Finalmente, discute-se brevemente como, a partir da teoria de grafos probabilísticos, podem ser deduzidas versões distribuídas dos algoritmos propostos, adequadas para operação em redes de sensores/receptores.

Palestrante: Elder M. Hemerly
Título:
Introdução e Aplicações em Sistemas de Navegação
Resumo
Sistemas de navegação baseados em integração de múltiplos sensores (inercial, GPS, odômetro, dentre outros) objetivam explorar as boas características de cada sensor. Um caso típico se refere à fusão IMU/GPS: o primeiro assegura elevadas taxas de amostragem e é imune a interferências, enquanto o segundo proporciona leituras de posição sem derivas. Embora diversas abordagens possam ser utilizadas para se realizar a integração, o uso do Filtro de Kalman é particularmente eficiente, pois sistematiza o projeto decompondo-o em duas fases: a) modelagem dos erros e b) sintonização dos parâmetros de projeto. Os principais aspectos teóricos e práticos envolvidos no desenvolvimento de sistemas de navegação usando múltiplos sensores, via Filtro de Kalman, serão abordados nesta palestra. Exemplos típicos de aplicação serão apresentados e discutidos.

Palestrante: Marcel T. Vieira
Título:
Covariance Structure Models for Longitudinal Complex Survey Data
Resumo
Complex designs are often used to select the sample which is followed over time in a panel survey. We consider some parametric models for panel data and discuss methods of estimating the model parameters which allow for complex schemes. We incorporate survey weights into alternative point estimation procedures. These procedures include pseudo maximum likelihood (PML) and various forms of generalized least squares (GLS). We also consider variance estimation using linearization methods to allow for complex sampling. The behaviour of the proposed inference procedures are assessed in a simulation study, based upon data from the British Household Panel Survey. The point estimators have broadly similar performance, with few significant gains from GLS estimation over PML estimation. The need to allow for clustering in variance estimation methods is demonstrated. Linearization variance estimation performs better, in terms of bias, for the PML estimator compared to a GLS estimator. Some extensions to model fitting statistics when working with longitudinal data in a complex survey design framework are also considered.

Palestrante: Flavio B. Gonçalves
Título:
Simulação exata e inferência em processos de difusão
Resumo
Nesta palestra, vou apresentar o Exact Algorithm proposto em Beskos, Papaspiliopoulos and Roberts (2006) para simulação exata de uma classe de processos de difusão. O algoritmo é exato no sentido de não apresentar erro de discretização. Posteriormente, vou apresentar um método baseado no Exact Algorithm para fazer inferência em processos de difusão (Beskos et al., 2006). No final, menciono um pouco do meu trabalho em processos de difusão com saltos.
Referências:
Beskos, A; Papaspiliopoulos, O. e Roberts, G. O. (2006). Retrospective exact simulation of diffusion sample paths with applications. Bernoulli, 12 (6), 1077-1098.
Beskos, A., Papaspiliopoulos, O., Roberts, G. O., e Fearnhead, P. (2006), Exact and computationally efficient likelihood-based inference for discretely observed diffusion processes (with discussion), J. R. Stat. Soc. B 68(3), 33-382.
 

Palestrante: Marco A. R. Ferreira
Título:
Gaussian multiscale spatio-temporal models
Resumo
We develop a new class of multiscale spatio-temporal models for Gaussian areal data. Our framework decomposes the spatio-temporal observations and underlying process into several scales of resolution.  Under this decomposition the model evolves the multiscale coefficients through time with structural state-space equations. The multiscale decomposition considered here, which includes wavelet decompositions as particular case, is able to accommodate irregular grids and heteroscedastic errors. The multiscale spatio-temporal framework we develop has several salient attributes. First, the multiscale decomposition leads to an extremely efficient divide-and-conquer estimation algorithm. Second, the multiscale coefficients have an interpretation of their own; thus, the multiscale spatio-temporal framework may offer new insight on understudied multiscale aspects of spatio-temporal observations. Finally, deterministic relationships between different resolution levels are automatically respected for both the observations, the latent process, and the estimated latent process. We illustrate the use of our multiscale framework with an analysis of a spatio-temporal dataset on agriculture production in the state of Espirito Santo, Brazil.
Joint work with Adelmo Bertolde and Scott Holan.

 

Palestrante: Hedibert Lopes
Título:
Particle learning and smoothing
Resumo
This paper provides novel particle learning (PL) methods for sequential parameter learning and smoothing in state space models with non-normal errors, non-linear observation equations, and non-linear state evolutions. The methods extend existing particle methods by incorporating unknown parameters, utilizing sufficient statistics, for the parameters and/or the states, and allowing for nonlinearities in the state and/or observation equation. We also show how to solve the state smoothing problem, integrating out parameter uncertainty. Previously, the only approach available for this marginal smoothing problem is MCMC. We show that our algorithms outperform MCMC, as well existing particle filtering algorithms such as the mixture Kalman filter.
Joint work with Carlos M. Carvalho, Michael Johannes and Nicholas Polson.

 


1º semestre de 2008
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 25/07 (excepcionalmente 6ª feira) Danny Pfeffermann (Jerusalem/Southampton)
    Título: Small area estimation, the state of the art (Resumo)
  • 25/06 Pedro Dias (LNCC/USP)
    Título: Mudanças climáticas: como conviver com as incertezas? (Resumo)
  • 07/05 Marcel T. Vieira (UFJF)
    Título: (adiado para o dia 03/09)
  • 30/04 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente no IMPA, Auditório Ricardo Mañé às 13:30 horas)
    • Pierre Nolin (ENS-Paris)
      Título: Near-critical percolation and the geometry of diffusion fronts (Resumo)
    • Wendelin Werner, Medalha Fields 2006 (ENS-Paris)
      Título: Are random frontiers always symmetric? (Resumo)
  • 09/04 Vitor Ozaki (ESALQ-USP)
    Título: Modelos de fronteira estocástica de custo com forma funcional flexível Fourier: uma abordagem Bayesiana (Resumo)
  • 28/03 (excepcionalmente às 13:30h) Trevor Bailey (Exeter)
    Título: Spatial survival modelling in animal disease epidemics (Resumo)
  • 12/03 (excepcionalmente às 15:00h) Pasquale Valentini (Pescara)
    Título: Reduced rank regression and its applications in spatial and stochastic frontier analysis (Resumo)
  • 05/03 Reunião entre Alunos e Corpo Docente

Resumos das Palestras do 1º semestre de 2008
 

Palestrante: Danny Pfeffermann
Título:
Small area estimation, the state of the art
Resumo
In this presentation I shall review the methods proposed in the literature for small area estimation. The following approaches and methods will be covered: 1. Design-based methods, advantages and limitations 2. Frequentist model based methods 3. Bayesian model-based methods 4. Methods using time series/cross-sectional models 5. Recent advances: Accounting for measurement errors and outliers, choice of priors, ranking, M-quantiles,…

Palestrante: Pedro Dias
Título:
Mudanças climáticas: como conviver com as incertezas?
Resumo
O Painel Intergovernamental de Mudanças Climáticas (IPCC) aponta, claramente, para cenários climáticos para os próximos 100 anos nos quais o efeito antrópico é evidente.  Os cenários do IPCC são mais sólidos no que se refere às características médias do clima terrestre. Por exemplo,  a temperatura media da terra deve aumentar assim como as chuvas. Entretanto, ninguém vive no chamado “clima médio terrestre” e existe incerteza significativa quanto aos efeitos regionais apesar de ter havido grande  no último relatório quanto aos aspectos climáticos regionais. O IPCC também aponta para extremos climáticos mais freqüentes (secas , enchentes, ondas de calor e mesmo de frio). Portanto, é evidente que é preciso estabelecer políticas públicas que nos preparem para situações climáticas adversas.  Em primeiro lugar, devemos aprender a conviver com a variabilidade climática natural.  É preciso reconhecer que já tivemos flutuações climáticas de causas estritamente naturais de grande porte. Por ex., a década de 40-60 foi cerca de 15% mais seca no SE brasileiro que o período 70-90. Houve evidente impacto na utilização de recursos hídricos para a geração de energia elétrica e na agricultura. Esses eventos do passado recente precisam ser melhor estudados, do ponto de vista dos impactos sociais e econômicos.  Outro aspecto fundamental que as políticas públicas devem abordar: quanto investir na redução das emissões e na adaptação? O custo da descarbonização da nossa economia precisa ser melhor avaliado. O custo da adaptação também necessita melhor quantificação. A decisão quanto ao caminho futuro  
depende de uma análise critica desses custos e das incertezas nos cenários futuros.

Palestrante: Wendelin Werner
Título:
Are random frontiers always symmetric?
Resumo
We will make comments on the following problem: Suppose that a two- dimensional domain is created at random from many infinitesimal local inputs, and that one only observes its outer boundary. Can one detect on which side the domain is by looking at a portion of this boundary? The talk is partly based on joint work with Pierre Nolin.

Palestrante: Pierre Nolin
Título:
Near-critical percolation and the geometry of diffusion fronts
Resumo
We discuss a model of inhomogeneous medium known as "Gradient Percolation", which is an inhomogeneous percolation process where the den- sity of occupied sites depends on the location in space. This model was ¯rst introduced by the physicists Gouyet, Rosso and Sapoval in 1985 to show nu- merical evidence that diffusion fronts are fractal. The macroscopic interface - separating occupied sites and vacant sites - that appears remains localized in regions where the density of occupied sites is close to the percolation threshold pc, and its behavior can be described using properties of near-critical standard percolation. This allows to study a simple two-dimensional model where a large number of particles that start at a given site diffuse independently. As the particles evolve, a concentration gradient appears and we observe a macroscopic interface. We exhibit in particular a regime where this (properly rescaled) interface is fractal with dimension 7/4: this model thus provides a natural setting where fractal geometry spontaneously arises, as predicted by physicists.

Palestrante: Vitor Ozaki
Título:
Modelos de fronteira estocástica de custo com forma funcional flexível Fourier: uma abordagem Bayesiana
Resumo
O processo de quantificar eficiência de firmas consiste em comparar firmas dentro da mesma tecnologia de produção, valorizando as que utilizam melhor seus insumos e produtos, minimizam seus custos ou maximizam seus lucros. Existe uma variedade de formas funcionais utilizadas em modelos de fronteira estocástica, as mais conhecidas são a Cobb-Douglas, translog e Leontief generalizada e algumas vezes é difícil julgar qual delas deve ser escolhida, desde que a forma verdadeira é desconhecida e pode ser somente aproximada. O objetivo deste trabalho é calcular a eficiência econômica de cada firma envolvida no processo de produção utilizando os modelos de fronteira estocástica de custo com forma funcional flexível Fourier, que aproximam a fronteira da função de custo verdadeira tanto quanto os dados permitirem, através da abordagem Bayesiana. Apresenta-se um estudo de simulação e analisa-se dados reais que referem-se a 382 hospitais nos Estados Unidos, observados nos anos de 1987 a 1991. Palestrante: Trevor Bayley
Título:
Spatial survival modelling in animal disease epidemics
Resumo
The potentially large economic impacts of animal disease epidemics have been highlighted in recent years through outbreaks such as foot-and-mouth disease (FMD) in the UK during 2001. This talk reports work from a project with the Veterinary Laboratories Agency (VLA), Weybridge, UK which was concerned with use of survival modelling to develop dynamic space-time predictions of survivor and hazard functions for individual farm premises as an FMD epidemic progresses. Such survival analyses could provide powerful insights into the patterns of infection, and assist in optimising various aspects of the operational response activities, such as targeting of `at-risk' premises. The talk will discuss and compare various possible model formulations using both simulated and real data based on the 2001 UK FMD epidemic and then go on to illustrate how model predictions may be used to refine response activities. Palestrante: Pasquale Valentini
Título:
Reduced rank regression and its applications in spatial and stochastic frontier analysis
Resumo
The talk considers the general model of reduced rank regression (RRR). RRR is useful to model the asymmetric linear relationship between two sets of predictants and predictors. Sometimes there is a need to reduce the number of parameters in the multivariate regression model imposing constraints on the rank, r, of the matrix of coefficients. A special case of interest is when r=1, which allows for the discussion of a model with applications in multi-output stochastic frontier analysis and spatial regression models.

2º semestre de 2007
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário
.


  • 10/12 (excepcionalmente 2a feira) Peter Guttorp (Washington)
    Título: Modeling extremes for air pollution and climate (Resumo)
  • 21 /11 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente no CBPF, Auditório do 6o andar às 15 horas)
    • André Nachbin (IMPA)
      Título: Ondas em meios desordenados (Resumo)
    • Alejandro C. Frery (UFAL/IMPA)
      Título: Redes de sensores sem fio (Resumo)
  • 12/11 (excepcionalmente 2a feira) Carlos D. Paulino (Lisboa)
    Título: Infecção viral pelo papiloma humano – uma análise bayesiana de regressão binomial com resposta mal classificada (Resumo)
  • 05/11 (excepcionalmente 2a feira) Hedibert F. Lopes (Chicago)
    Título: Sex chromosome evolution and gene expression in Drosophila spermatogenesis (Resumo)
  • 31/10  Corpo Docente da PG - Estatística
    Título: Apresentação das linhas de pesquisa do Programa de Pós-Graduação em Estatística do IM-UFRJ
  • 17/10 Otto Côrrea Rotunno (UFRJ)
    Título: Modelagem hidrológica-atmosférica aplicada a gestão de bacias hidrográficas (Resumo)
  • 03/10 Leandro Pimentel (USP)
    Título: Métricas sobre triangulações aleatórias do plano (Resumo)
  • 19/09 Gerson Zaverucha (UFRJ)
    Título: Avanços em Revisão de Teorias de Primeira Ordem e em Previsão de Séries Temporais (Resumo)
  • 12/09 Prévias de Mestrado
    Palestrante: Felipe Rafael Ribeiro Melo
    Título: Estimação das taxas de infecção e cura no Processo de Contato
    Palestrante: Leonardo Correia da Costa
    Título:
    Modelos de fronteira estocástica com componente espacialPalestrante: Luiz Ledo Mota Melo Jr
    Título: Modelos espaço-temporais aplicados a óbitos por causas externas no estado do Paraná
    Palestrante: Fabio Figueiredo Farias
    Título:
     Previsão de resultados em partidas de futebol
  • 22/08 Flávio F. Nobre (UFRJ)
    Título: Métodos Estatísticos e Computacionais em Análise de Dados Epidemiológicos e na Genômica Computacional e Bioinformática (Resumo)

Resumos das Palestras do 2º semestre de 2007
 

Palestrante: Peter Guttorp
Título:
Modeling extremes for air pollution and climate
Resumo
Air quality regulations are often set based on observations at approved monitoring stations. However, the intent of the regulation is typically to protect people in a larger area from dangerous exposure to pollution. We look at the distribution of the maximum of a transformed Gaussian process over a finite set to assess the effective protection of an observation just within the limits of regulation. The technical tool needed is a generalization of Rice's formula to two dimensions. Recent work in human-induced climate change attempts to attribute extreme events to climatic changes, by simulating climate with and without antrhopogenic forcing. We look at some tools available for modeling extreme climate events, look at some data analytic approaches, and discuss possible ways of estimating trends in extreme climate events.

Palestrante: André Nachbin
Título:
Ondas em meios desordenados

Resumo
O principal foco deste trabalho está na modelagem física e matemática de ondas em meios heterogêneos. Muitos problemas nesta área lidam com meios de propagação tendo propriedades físicas que oscilam rapidamente e de forma desordenada. Em muitos destes casos é interessante utilizar modelagem estocástica. Por exemplo, com equações diferenciais parciais (EDPs) apresentando coeficientes aleatórios. Diferentes técnicas podem ser consideradas: homogeneização, teoria dos campos médios ou análise assintótica de equações diferenciais estocásticas. Para o nosso contexto de ondas interagindo com uma microestrutura, discutiremos brevemente os diferentes significados físicos destas diferentes técnicas. E também indicaremos como apenas a última captura com precisão os fenômenos de interesse: o da Difusão Aparente, assim como o da refocalização de pulsos por Reversão- Temporal. E ainda temos um fato surpreendente: o fenômeno de refocalização é mais eficiente em um ambiente aleatório do que no caso homogêneo! Resultados da modelagem e teoria matemática serão ilustrados através de simulações computacionais, em particular, para ondas acústicas e ondas aquáticas longas como, por exemplo, tsunamis.

Palestrante: Alejandro C. Frery
Título:
Redes de sensores sem fio

Resumo
As redes de sensores sem fio (Wireless Sensor Networks) são conjuntos de dispositivos que obtêm amostras de fenômenos ambientais, sejam eles naturais (como, por exemplo, temperatura, pressão atmosférica, intensidade de iluminação, concentração de substâncias em cursos d'água) ou antrópicos (qualidade do ar em sinais de trânsito, pressão ao longo de um oleoduto). Cada sensor coleta informações de forma contínua ou em instantes de tempo que podem ser regulares ou disparados por eventos. Essas informações são repassadas a nós especiais que, tipicamente, aplicam operações para reduzir o volume de dados, e, feito isso, novamente as enviam para um nó central onde decisões são tomadas. Essa é uma vigorosa área de pesquisa multidisciplinar, com inúmeros problemas que abrangem desde a modelagem dos processos associados e estratégias de inferência, até aspectos tecnológicos aguardando por soluções satisfatórias. Nesta palestra apresentaremos os principais conceitos relativos às redes de sensores sem fio, no intuito de discutir algumas dessas oportunidades de pesquisa. Palestrante: Carlos D. Paulino
Título:
Infecção viral pelo papiloma humano – uma análise bayesiana de regressão binomial com resposta mal classificada
Resumo
Motivados por um estudo da infecção em mulheres pelo vírus papiloma humano, apresentamos uma análise bayesiana de regressão Binomial em que a variável resposta é susceptível de classificação errada. A nossa abordagem iterativa conduz a inferências aproximadas (com grau de aproximação controlável pelo analista) sobre as probabilidades de classificação errada e sobre os parâmetros que representam efeitos das covariáveis nas probabilidades de resposta para vários modelos lineares generalizados, tornando possível a selecção de modelos. Palestrante: Hedibert F. Lopes
Título:
Sex chromosome evolution and gene expression in Drosophila spermatogenesis
Resumo
Background: The Drosophila genome is constituted of a group of genes that are distributed in diferent chromosomes: three pairs of autosomes and the sex chromosomes (X and Y). The study of sex chromosome evolution main purpose is to understand which genes are localized in and out of the sex chromosomes. In addition, evolutionary biologists are interested in understanding the mechanisms and selective forces driving such distribution. In the last decade, one important observation regarding the evolution of sex chromosomes is the unidirectional movement of genes out of the X chromosome to the autosomes. Interestingly, those genes are especially expressed (active) in the male reproductive tract, the testis. One explanation for the unidirectional movement of genes is the possible X inactivation during spermatogenesis (spermatozoa formation and development). In other words, if X is inactivated then spermatogenic expressed genes that move out of the X chromosome to autosomes are expected to be selected during evolution. However, the spermatogenic X-inactivation has not yet been proved in Drosophila. There are only indirect evidences that strongly suggest that the X chromosome ceases its expression during spermatogenic meiotic stage. Moreover, even if the X becomes inactive, the unidirectional movement of genes out of X chromosome is not necessarily caused by the decrease of expression level. Results: Here we investigate meiotic X-inactivation in Drosophila melanogaster by monitoring X-linked and autosome gene expression during developmental phases of spermatogenesis. Cells from two di erent phases were collected: spermatogonias, the mitotic cells; and spermatocytes, the cells in meiotic division. Genes that are putatively over or under expressed in meiosis were selected by quantifying and comparing the mRNA level in the two di erent phases using Microarray analysis (Genechip arrays from A ymetrix). Multiple hypothesis testing and inference were conducted by Bayesian hierarchical modeling (BHM) in order to classify 18,000 genes (3,000 X-linked genes and 15,000 autosome genes) as over, under, equally expressed. The main motivation for using this modeling structure is to avoid inconsistencies of standard frequentist multiple hypothesis testing commonly encountered in the analysis of gene expression. In agreement to Xinactivation hypothesis, we observed depletion and enrichment of X-linked genes over and under expressed in meiosis, respectively. In other words, the expression of X-linked genes is under represented in meiosis compared to autosome genes. In order to investigate if X-inactivation is one of the selective forces driving the unidirectional movement of genes out the X chromosomes, we compared gene expression of a specific set of genes that moved between chromosomes during Drosophila genus evolution. We show that, based on an extension of the previous BHM, genes moving out of the X-chromosome have a higher posterior probability of being under-expressed in meiosis than genes moving out of the autosomes. Conclusion: By properly accounting for the uncertainties regarding the gene expression measurements and interactions, as well as gene biology, our modeling approach explicitly and probabilistically quantifies X-linked gene expression, pointing in favor of the X-inactivation hypothesis. In addition, pioneer evidence of meiotic X chromosome under-expression as driving force for gene movement out of the X chromosome is provided.

Palestrante: Otto Côrrea Rotunno
Título:
Modelagem hidrológica-atmosférica aplicada a gestão de bacias hidrográficas

Resumo
Com a preocupação cada vez maior com o meio ambiente, surge a necessidade de se estudarem modelos que reconheçam e representem adequadamente as características hidrológicas de uma determinada região, para que se possam obter resultados confiáveis quando da simulação dos efeitos causados pela mudança no uso do solo, desmatamento, ou mesmo, poluição ou erosão do meio natural.

Deve-se, no entanto, ressaltar que a modelagem hidrológica com base física não deve estar dissociada do contexto de sua aplicação: a bacia hidrográfica e o seu respectivo gerenciamento. Nesse sentido, o presente seminário visa a discussão sobre a construção de uma base de dados e o desenvolvimento de ferramentas de análise integráveis a um sistema de apoio à decisão voltado à gestão de recursos hídricos. O enfoque concentra-se na geração e consolidação de informação temática básica, desenvolvimento e avaliação de metodologias na escala da bacia hidrográfica com base na implementação de áreas especialmente monitoradas.

Palestrante: Leandro Pimentel
Título:
Métricas sobre triangulações aleatórias do plano

Resumo
Neste seminário iremos estudar o comportamento assintótico de métricas aleatórias definidas sobre triangulações aleatórias do plano. Focaremos em questões como Leis dos Grandes Números e Teorema do Limite Central.


Palestrante
: Gerson Zaverucha

Título:
Avanços em Revisão de Teorias de Primeira Ordem e em Previsão de Séries Temporais

Resumo
A palestra será dividida em duas partes, conforme indica o título. Na primeira parte, Revisão de teorias é o processo de melhorar teorias geradas automaticamente ou definidas pelo usuário, dado um conjunto de exemplos. A utilização de sistemas de revisão de teorias de Primeira-ordem tem sido limitada pelo custo de buscar em um grande espaço de hipóteses. Esta é uma dificuldade geral no aprendizado de teorias, mas trabalhos recentes mostram que técnicas de busca local estocástica (SLS) são efetivas ao menos quando as teorias são aprendidas a partir do zero. Serão apresentados uma introdução aos algoritmos de revisão de teorias de primeira-ordem tanto lógicas (FOL) quanto probabilísticas (SRL) e então algoritmos que aplicam SLS a esses sistemas de revisão de teorias. Resultados experimentais mostram que: (1) o tempo de execução é reduzido significativamente; (2) a acurácia em relação a teoria inicial obtida através do sistema de ILP Aleph é sempre melhorada.
Na segunda parte, será apresentado um sistema de previsão de séries temporais baseado em ensemble de filtros de partículas utilizando estimação não-paramétrica de densidade com kernels para a representação dos modelos de transição e observação, fazendo o aprendizado dos kernels através de um algoritmo baseado no EM, e selecionando os componentes do ensemble pela análise das Curvas de Erros de Regressão (REC).

Palestrante: Flávio F. Nobre
Título:
Métodos Estatísticos e Computacionais em Análise de Dados Epidemiológicos e na Genômica Computacional e Bioinformática

Resumo
Nessa palestra serão inicialmente apresentados temas relacionados com séries temporais e análise espacial em epidemiologia utilizando técnicas de redes neurais e teoria de grafos. A seguir, apresentaremos temas relacionados com a área de Genômica Computacional e Bioinformática, recentemente criada no Laboratório de Engenharia de Sistemas em Saúde –LESS, enfocando a utilização de técnicas estatísticas e computacionais na análise de experimentos de microarranjos de cDNA para identificação de genes diferencialmente expressos e classificação de tumores, bem como pesquisa relativa a identificação e monitoração de resistência genotípica (mutações do HIV) em pacientes em uso de terapia antiretroviral.

1º semestre de 2007
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.


  • 04/07 Bruno Sansó (UCSC - EUA) (Resumo)
    Título:  Spatially Varying Temperature Trends in a Central California Estuary

  • 29/06 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente 6a feira as 13:30h, IM-UFRJ C-116)
    • Ronald Dickman (UFMG)
      Título: Fluidos com interações repulsivas numa escada meio-dirigida: decaimento lento de correlações
    • Nancy L. Garcia (UNICAMP)
      Título: Spatial birth and death processes as solutions of stochastic equations

  • 20/06 Reunião entre Alunos e Corpo Docente

  • 13/06 Fernando Moala  (UNESP - SP) (Resumo)
    Título:  Elicitação de distribuições a priori multivariadas : Um procedimento Bayesiano não-paramétrico

  • 23/05 Sergio Firpo  (PUC - RJ) (Resumo)
    Título:  Bounding the Distribution of Treatment Effects

  • 09/05 Roberto Imbuzeiro Oliveira  (IMPA - RJ) (Resumo)
    Título:  Acoplamento de caminhos e convergência ao equilíbrio de passeios aleatórios sobre matrizes

  • 09/04 Colóquio Inter-institucional "Modelos Estocásticos e Aplicações" (excepcionalmente as 13:30h no IMPA sala  232)
    • Renato Martins Assunção (UFMG)
      Título: Testes Monte Carlo sequenciais e de tamanho fixo
    • Alexandra M. Schmidt (IM-UFRJ)
      Título: Modelagem de processos espaciais e espaço-temporais

  • 28/03 Marlos Viana  (University of Illinois - USA) (Resumo)
    Título:  Aspectos Estatísticos do Teorema da Decomposição Canônica para Grupos Finitos

Resumos das Palestras do 1º semestre de 2007

Palestrante: Bruno Sansó (UCSC - EUA)
Título:
Spatially Varying Temperature Trends in a Central California Estuary
Resumo
We consider monthly temperature data collected over a period of 16 years at 24 stations in the estuarine wetlands of the Elkhorn Slough watershed, located in the Monterey Bay area in Central California, USA. Our goal is to develop a statistical model in order to separate the seasonal cycle, short term fluctuations and long term trends, while accounting for the spatial variability of these features. In the model, each station has a specific, time-invariant mixture of two seasonal patterns, to encompass the spatial variability of oceanic influence. Likewise, trends are modeled as local mixtures of two patterns, to include the spatial variability of long term temperature change. Finally, all stations share a common baseline, whose temporal variability is linearly dependent on a variable that summarizes several atmospheric measurements. We use a Bayesian approach with a purposely developed Markov chain Monte Carlo method to explore the posterior distribution of the parameters. We find that the seasonal cycles have changed in time, that neighboring stations can have substantially different  behaviors and that most stations show significant warming trends.


Palestrante: Fernando A. Moala (FCT - UNESP)
Título:
Elicitação de distribuições a priori multivariadas : Um procedimento Bayesiano não-paramétrico
Resumo
A elicitação de prioris é um importante tópico da Inferência Bayesiana e tem sido utilizada em muitas áreas aplicadas do conhecimento, principalmente em situações nas quais os dados experimentais não são tão numerosos devido a dificuldade ou custo para obtê-los. Através da elicitação o estatístico pode incorporar formalmente a opinião a priori de um especialista na forma de uma distribuição de probabilidade. Há vários métodos diferentes de se elicitar distribuições a priori propostas na literatura; a maioria deles para a construção de uma distribuição a priori com apenas um parâmetro desconhecido. Porém, há poucos métodos para especificação de uma distribuição a priori para vetores de parâmetros desconhecidos. Além disso, muitos desses métodos  requer a elicitação de momentos de segunda ordem e/ou a elicitação de hiperparâmetros o qual torna difícil sua aplicação prática. É proposto um método mais flexível de elicitar distribuições a priori multivariadas aplicável a uma vasta classe de  problemas práticos. O método não assume uma forma paramétrica  para a distribuição a priori desconhecida f( . ). Sendo assim, é usado Inferência Bayesiana Não-paramétrica, modelando f( .) através de um processo Gaussiano a priori. Dado um pequeno número de julgamentos do especialista, tais como quartis de sua distribuição e três ou quatro probabilidades conjuntas, obtém-se a  distribuição a posteriori para f( . ). Propriedades teóricas das distriuições a priori conjunta e marginais são determinadas e também são apresentadas ilustrações numéricas para demonstrar o procedimento.


Palestrante: Sergio Firpo (PUC - RJ)
Título:
Bounding the Distribution of Treatment Effects
Resumo
We use bounds on the distribution function of the sum of two random variables with known marginal distributions obtained by Makarov (1981) to bound the distribution function of the individual treatment effect. Although the Makarov bounds are pointwise sharp if we only consider the marginals, they can be improved by using the fact that we know the mean (and only the mean) of the treatment effect distribution, i.e. the Average Treatment Effect. We propose a procedure that uses this additional information to obtain more informative bounds. We also show that if the treatment effect varies with observable covariates, averaging over these covariates improves the Makarov bounds. We can combine the two types of additional information by using the known conditional treatment effect means to improve the conditional Makarov bounds and by subsequently averaging these conditional bounds. The (improved) Makarov bounds on the cdf of the treatment effect distribution yield bounds on the quantiles of that distribution. Without covariates we can use the ATE to directly obtain bounds on these quantiles, that turn out to be identical to the bounds obtained by using the ATE to improve the cdf bounds. By this equivalence we can use the average improved conditional Makarov bounds that use information on the conditional ATE to improve the bounds on the unconditional quantiles. Bounds on the conditional quantiles cannot be averaged to obtain bounds on the unconditional quantiles. We illustrate the qualitative features of the bounds for normal and dichotomous outcome distributions."


Palestrante: Roberto Imbuzeiro Oliveira (IMPA - RJ)
Título:
Acoplamento de caminhos e convergência ao equilíbrio de passeios aleatórios sobre matrizes
Resumo
Kac e Hastings propuseram um modelo de passeio aleatório sobre matrizes de rotação em n dimensões em que cada passo é uma rotação por um ângulo aleatório do plano gerado por duas coordenadas aleatórias. Este passeio pode ser usado em problemas de Física e Computação em que se busca simular a distribuição uniforme (Haar) sobre essas matrizes. Para isso, no entanto, é necessário saber o quão rápido este processo  de Markov converge ao equilíbrio. Mostraremos nesta palestra que a convergência se dá em aproximadamente n^2 ln n passos de acordo com uma certa métrica sobre distribuições. O principal ingrediente da prova é uma forma de acoplamento chamada de "acoplamento por caminhos" que adaptamos da literatura de cadeias de Markov discretas. Acreditamos que esta técnica pode ter muitas outras aplicações na análise de métodos de Monte-Carlo sobre espaços contínuos.

Palestrante: Marlos Viana  (University of Illinois - USA)
Título:
Aspectos Estatísticos do Teorema da Decomposição Canônica para Grupos Finitos
Resumo
Este seminário apresentará um resumo das aplicações estatísticas dos teorema da decomposição canônica para grupos finitos decorrentes de sua relação natural com a teoria clássica de Fisher-Cochran sobre formas quadráticas (análise de variância) e com as noções de planejamentos de experimentos presentes nos trabalhos seminais de R. Fisher. Resultados recentes parecem identificar a teoria classical de planejamento de experimentos com o estudo (via análise harmônica) de dados indexados por grupos Abelianos finitos- de modo que essencialmente um tipo de grupo define o experimento. O princípio de estudos de simetria aqui exposto inclui a noção de grupo experimental- na qual a escolha dos diversos grupos de transformações (Abelianos ou não) atuando nos diversos rótulos experimentais torna-se parte integral do planejamento, análise e interpretação dos experimentos.

2º semestre de 2006
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

  • 06/12 Prévias de Mestrado
    Palestrante: Gilmar Jorge de Oliveira Jr. (Resumo)
    Título: Soma de variáveis aleatórias independentes:  aplicações em atuária e finanças  Palestrante: Joaquim Henriques Vianna Neto (Resumo)  
    Título:
    Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de  Estimação em Pequenos Domínios
     
  • 22/11 Milan Merkle (Professor Visitante - UFRJ) (Resumo)
    Título: Spatial medians and centers of multidimensional distributions
     
     
  • 08/11 (excepcionalmente na sala C-100) Prévias de Mestrado
    Palestrante: Flavio B. Gonçalves (Resumo)
    Título: Análise Bayesiana da Teoria de Resposta ao Item: uma Abordagem Generalizada 

    Palestrante: Vinicius D. Mayrink (Resumo)  
    Título:
    Aspectos computacionais de modelos espaciais.  

 

  • 11/10 Adilson Elias Xavier (COPPE Sistemas - UFRJ) (Resumo)
    Título:  Resolução de problemas de agrupamento (clustering) via suavização hiperbólica

  • 04/10 Reunião entre Alunos e Corpo Docente

  • 20/09 Camilo Daleles Rennó (DPI-INPE) (Resumo)
    Título:  Modelos Hidrológicos Distribuídos

  • 30/08 Mauricio Zevallos (IME - Unicamp) (Resumo)
    Título:  Influential observations in conditional heteroscedastic time series

  • 17/08 Colóquio Inter-Institucional  Processos Estocásticos e Aplicações Local: LNCC a partir das 13:30h

Resumos das Palestras do 2º semestre 2006

Palestrante
: Gilmar Jorge de Oliveira Jr.

Título:
Soma de variáveis aleatórias independentes:
aplicações em atuária e finanças
Resumo
A teoria do risco tradicional assume que os riscos individuais de uma carteira de seguro sejam  independentes. A determinação da função distribuição dos sinistros agregados é obtida através de  recursões de Panjer ou de De Pril, convoluções ou aproximação por momentos. A tendência moderna  em atuaria é  modelar conjuntamente  os  riscos atuárial e finaceiro, gerando, como veremos, somas de variáveis aleatórias dependentes.  Grande esforço tem sido desenvolvido, na literatura  recente, para determinar  limites superior e inferior para a distribuição do sinistro agregado. Nesta apresentação ilustraremos esses principios e nossa proposta futura é fazer a inferência nesses modelos, sobretudo do ponto de vista Bayesiano.
Palestrante: Joaquim Henriques Vianna Neto
Título:
Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de  Estimação em Pequenos Domínios
Resumo
O termo pequenos 
domínios (ou pequenas áreas) é freqüentemente utilizado para denominar áreas geográficas pequenas, tais como municípios, distritos e bairros. Num sentido mais amplo, é utilizado também para descrever um pequeno subconjunto da população, podendo ser, inclusive, resultado da classificação cruzada de duas ou mais variáveis. As informações para pequenas áreas podem ser obtidas a partir de censos e enumerações populacionais, com a população sendo inteiramente investigada, ou através de pesquisas por amostragem. Pesquisas por amostragem geralmente têm como principal característica um tamanho de amostra reduzido nas pequenas áreas; ou até mesmo a ausência de unidades amostrais em algumas áreas. Dessa forma, não é possível obter estimativas com boa precisão a partir de estimadores diretos, baseados unicamente no desenho da amostra.  Uma alternativa é utilizar uma abordagem que considere também as estimações de regiões vizinhas no espaço e no tempo. Para isso, são utilizados aqui, modelos dinâmicos bayesianos de crescimento exponencial com componentes que variam espacialmente segundo um processo gaussiano. Particularmente, apresentamos uma aplicação à dados do Censo Demográfico Brasileiro e da Pesquisa Nacional por Amostra de Domicílios (PNAD), ambos divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O objetivo é obter as estimativas dos tamanhos populacionais dos municípios incluídos na amostra da PNAD, combinando os dados da pesquisa com aqueles dos censos. Ao utilizar dados de pesquisas com diferentes variabilidades e tipos de erros, é preciso considerar de modo diferenciado as precisões das informações levantadas. Neste trabalho, propomos uma modelagem conjunta de média e variância para identificar a quantidade de informação de um estimador a partir da estimativa de sua variância.
Palestrante: Milan Merkle (Universidade de Belgrado)
Título:
Spatial medians and centers of multidimensional distributions
Resumo
In a recent statistical literature, several concepts of a median of a multidimensional data set or a distribution have been introduced. The idea is always to select one determining property of the median of a real valued random variable and then try to generalize it in more dimensions. However, properties that are equivalent in one dimension are not necessarily equivalent in higher dimensions, and this is the reason why none of approachesmakes a definitive solution to defining what is also known as a center of multidimensional data set or a multivariate distribution. The talk is about yetanother approach, where we start with a novel equivalent definition of a median in a univariate case, extend it to multivariate, and then show a numberof interesting results in theory and applications. We discuss some properties of Type D depth functions introduced by Zuo and Serfling, Ann. Statistics 28 (2000), 461--482, and we show that the only reasonably well behaved depth function of this type is the halfspace depth.
 

Palestrante: Flavio B. Gonçalves (Pós-Graduação - UFRJ)
Título:
Análise Bayesiana da Teoria de Resposta ao Item: uma Abordagem Generalizada
Resumo
Nesta dissertação é feito um estudo generalizado da Teoria de Resposta ao Item (TRI) através de propostas que permitam a modelagem do funcionamento diferencial do item – DIF (Differential Item Functioning) no contexto da TRI usando uma abordagem bayesiana. Primeiramente, é proposto um modelo de TRI que considera a existência de DIF(na discriminação e na dificuldade), porém, assumindo-se a hipótese de que os itens com DIF são conhecidos. São feitos estudos de simulação paraanalisar a eficiência do modelo e da metodologia utilizada para se fazer a inferência.  Além disso, omodelo é aplicado para a análise de um conjunto de dados reais referente ao Programa Nova Escola do Estado do Rio de Janeiro. Posteriormente, é propostoum modelo que engloba a detecção de itens com DIF, ou seja, que não necessite da hipótese de se conhecer quais itens possuem funcionamentodiferencial. Novamente, são feitos estudos de simulação com tal modelo e também a análise do mesmo conjunto de dados reais.

Palestrante: Vinicius D. Mayrink (Pós-Graduação - UFRJ)
Título:
Aspectos computacionais de modelos espaciais.

Resumo
Nos últimos tempos vem crescendo o número de aplicações práticas realizando análises de dados espacialmente distribuídos em uma área. Diferentes modelagens podem ser determinadas dependendo do tipo de problema que se deseja estudar. A modelagem considerada neste trabalho leva em conta a divisão desta área em n regiões. Para cada região a variável de interesse  é observada sendo  o conjunto completo de observações.A estrutura de vizinhança que estabelece a relação de dependência entre as observações é um aspecto importante a ser considerado. O estudo de uma série de dados observados objetiva modelar e analisar esta dependência. A estrutura espacial mais simples é configurada da seguinte forma: A i-ésima observação, , apresenta dois vizinhos que são  e . Perceba que esta particular estrutura representa também uma série temporal com n observações, que está na classe dos Modelos Dinâmicos Lineares (MDL's).
Estruturas de vizinhanças mais complexas podem ser consideradas, isto é, uma observação qualquer apresenta três ou mais vizinhos. Neste caso devem ser utilizados modelos espaciais com estrutura de vizinhança mais geral. Levando em consideração as diferentes possibilidades de especificação de uma estrutura espacial surge a seguinte reflexão: Quando uma área dividida em n regiões é analisada pode-se ter estruturas de vizinhanças mais simples, onde a maioria das regiões apresenta no máximo dois vizinhos, ou estruturas mais gerais onde o número de vizinhos é grande. Existiria influência da quantidade de vizinhos sobre o desempenho do modelo espacial utilizado? Que tipo de alterações observam-se nos resultados fornecidos ou nos algoritmos utilizados por estes modelos conforme o número de vizinhos é aumentado? A busca pela resposta destas questões tornou-se o principal objetivo que motivou o desenvolvimento deste trabalho. A análise bayesiana é empregada aqui e três esquemas, propostos na literatura, serão utilizados para a amostragem da distribuição a posteriori dos parâmetros do modelo. Estes esquemas diferem-se basicamente na estrutura de blocagem dos parâmetros que podem ser amostrados separadamente ou conjuntamente. É por meio deles que será estudado o desempenho dos modelos espaciais e dos algoritmos MCMC por eles utilizados perante diferentes quantidades de vizinhos.Iniciando pela aplicação de um modelo espacial simples este trabalho desempenha também uma extensão estudando o modelo espacial com componente de regressão múltipla. Diferentes aspectos são considerados para análise, entre eles estão resultados de inferência, verificação de convergência e análise da estrutura de autocorrelação das cadeias obtidas.
Palestrante: Adilson Elias Xavier (COPPE Sistemas - UFRJ)
Título:
Resolução de problemas de agrupamento (clustering) via suavização hiperbólica
Resumo
Nesta palestra, será considerado o Problema de Agrupamento (Clustering) segundo o critério de mínima soma de quadrados dentro dos grupos, ou equivalentemente, minimização da variância intragrupos. Esse critério, sendo muito natural, é o mais freqüentemente usado nas formulações de problemas de agrupamento. Adicionalmente à significante característica de sua natureza bi-nível, o problema associado tem a característica de ser fortemente não-diferenciável. A fim de superar essas dificuldades, a nova metodologia de resolução proposta adota uma estratégia de suavização usando uma especial função completamente diferenciável. Com o propósito de demonstrar a eficiência e a robustez do método, resultados computacionais obtidos na resolução de um conjunto canônico de problemas teste, descritos na literatura, são apresentados.
Palestrante:Camilo Daleles Rennó (DPI-INPE)
Título:
Modelos Hidrológicos Distribuídos
Resumo
Os modelos hidrológicos são ferramentas úteis para o entendimento do comportamento hidrológico de bacias hidrográficas. Estes modelos deveriam representar grande parte dos processos hidrológicos a fim de produzir resultados realistas. Entretanto, os modelos são apenas uma aproximação da realidade e requerem uma boa inicialização das variáveis de estado e uma grande quantidade de dados para representar apropriadamente os processos envolvidos. Esta apresentação visa discutir as diferentes abordagens utilizadas na construção de modelos hidrológicos distribuídos. Inicialmente, será apresentado o ciclo hidrológico e seus componentes. Aspectos relativos a discretização espacial e temporal serão também discutidos. Especificamente, serão apresentados os resultados do desenvolvimento do sistema SASHI (Sistema de Análise e Simulação Hidrológica). O enfoque principal é mostrar as diferenças das variáveis que alimentam modelos deste tipo.

Palestrante: Mauricio Zevallos (IME - Unicamp)
Título:
Influential observations in conditional heteroscedastic time series
Resumo
This paper examines local influence in exponential generalized autoregressive conditional heteroscedasticity (EGARCH) models. The analyses of local influence is discussed under three perturbations schemes: data perturbation and innovative and additive model perturbation. For each case expressions for slope and curvature diagnostics are derived. Monte Carlo experiments are presented in order to determine threshold values for locating influential observations. In addition, the empirical study of daily returns of the New York Stock Exchange composite index shows that local influence analyses is an important device for determining and classifying shocks in the market.

1º semestre de 2006
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

  • 07/07 (excepcionalmente as 15h) J Andres Christen   (CIMAT-Mexico) (Resumo)
    Título:  Radiocarbon peat chronologies and environmental change

  • 21/06 Antonio Miguel Vieira Monteiro (INPE) (Resumo)
    Título:  Tecnologias da informação espacial e estatística: experimentos com territórios digitais

  • 21/06 (excepcionalmente as 11h) (Exame de Qualificação) Ramiro Ruiz Cárdenas (UFRJ)
    Título:  Redesenho ótimo de redes de monitoramento ambiental

  • 20/06 (excepcionalmente as 14h) (Defesa de Tese de Doutorado) Mariane B. Alves (UERJ/UFRJ)
    Título:  Funções de transferência em modelos dinâmicos lineares generalizados

  • 19/06 (excepcionalmente as 14h) (Exame de Qualificação) Edna Afonso Reis (UFMG/UFRJ) (Resumo)
    Título:  Modelagem Bayesiana Dinâmica da Variação Temporal no Processo Espacial Pontual de Cox Log-Gaussiano

  • 17/05  (excepcionalmente as 14h) Colóquio Inter-Institucional: Modelos Estocásticos e Aplicações
    Marina S. Paez (IM-UFRJ) (Resumo)
    Título: Cox processes in time for point patterns and  their aggregations
Glauco Valle (IM-UFRJ) (Resumo)
Título: Estimativas e resultados de convergência para o modelo do votante
  • 10/05 Antonio Ponce de Leon (IMS-UERJ) (Resumo)
    Título: Planejamento Ótimo de Experimentos para Modelos com Estrutura Complexa de Variância

  • 12/04 (excepcionalmente as 15h no Salão Nobre do CCMN)   Ruben Klein (Cesgranrio/LNCC/MCT) (Resumo)
    Título: Avaliação e diagnósticos de desempenho

  • 03/04 (excepcionalmente 2a feira)   Teddy Seidenfeld (Carnegie Mellon University - EUA) (Resumo)
    Título: Multi-agent decision making and other settings for relaxing Bayesian theory      

  • 23/03 (excepcionalmente 5a feira)   Raquel Montes Diez (URJC - Espanha) (Resumo)
    Título: Bayesian Analysis of non-linear autoregression models based on neural networks

  • 09/03   Dani Gamerman e Corpo Docente PG-Estatística
    Título: Apresentação do Programa de Pós-Graduação em Estatística do IM-UFRJ  aos novos alunos

Resumos das Palestras do 1º semestre de 2006:

Palestrante
: J Andres Christen   (CIMAT-Mexico)

Título:
Radiocarbon peat chronologies and environmental change
Resumo
Raised bog peat deposits form important archives for reconstructing past climate changes. Precise and reliable age-models are of vital importance for interpreting such archives. We propose enhanced, MCMC-based methods for obtaining age-models from radiocarbon-dated peat cores, based on the assumption of piece-wise linear accumulation. Included are automatic choice of sections, a measure of the goodness-of-fit, and outlier downweighting.   Moreover, once having the age model at hand, the MCMC samples are used to plot pollen records from he peat core so as to obtain pollen levels along the calendar scale taking into account the variablity and unciertanties in the dataing.  The variability of pollen counts over time is then used as a proxy for climatic change which in turn can be observed within some noise levels.

Palestrante: AntonioMiguel Vieira Monteiro(INPE)
Título:
Tecnologias da informação espacial e estatística: experimentos com territórios digitais

Resumo
"O BraSil não conhece o BraSil". E isto é muito grave. As implicações são diretas para a gestão, organização e ordenamento do território brasileiro,com refelxos diretos na vida dos municipios e de cada cidadão. Como dizia o saudoso Mestre Milton Santos, "O território é o dado essencial dacondição da vida cotidiana". Então como conhecer o Brasil sem conhecer os Territórios Brasileiros?  Esta palestra vai procurar mostrar que esta nãoé uma tarefa exclusiva dos geógrafos e cientistas sociais, e tenta tratar a questão de  como podem Cientistas com origem nas Ciências Naturaisauxiliar na construção e acúmulo de conhecimento sobre a realidade brasileira a partir do conceito de “Territórios Digitais” e de suasrepresentacionais matemático-computacionais. Vamos ilustrar o tipo de problemas que enfrentamos , as ferramentas que podem nos ajudar, o poucojá feito e o muito que precisamos ainda fazer. Esperamos mostrar oportunidades de trabalhos de pesquisa e desenvolvimento em diferentes áreas daCiência da Computação e das Ciências Matemáticas e Estatísticas e da necessidade de sua estreita colaboração. Apresentaremos exemplos de um ambiente aberto promovido pelo INPE e parceiros que é nossa plataforma computacional para o desenvolvimento dos experimentos com o conceitoaqui apresentado, a TerraLib, e um exemplo de interação entre grupos das ciências médicas e sociais, matemáticos e estatísticos  e gruposdeEngenharia e Computação  para responder questões relevantes nos territórios da saúde pública, da segurança pública, dos  indicadoresde exclusão esegregação social em cidades e na modelagem da dinâmica de uso    e cobertura da terra na Amazônia Brasileira.
Palestrante: Edna Afonso Reis (UFMG/UFRJ)
Título:
Modelagem Bayesiana Din
âmica da Variação Temporal no Processo Espacial Pontual de Cox Log-Gaussiano
Resumo
Apresentamos um modelo de Cox log-gaussiano dinâmico para dados espaciais pontuais observados em diferentes instantes de tempo em uma região. O modelo é especificado por uma seqüência de superfícies de log-intensidade espaciais ligadas através do tempo e modeladas por processos gaussianos dinâmicos. A inferência é feita sob a abordagem Bayesiana, que incorpora naturalmente a característica estocástica da função de intensidade nestes processos. As log-intensidades e hiperparâmetros do modelo são estimados a partir de amostras de suas distribuições a posteriori, obtidas através de métodos Monte Carlo via cadeias de Markov, como o amostrador de Gibbs, com uso de passos de Metropolis-Hastings. Em particular, duas propostas de densidades para amostragem da posteriori das log-intensidades são apresentadas e comparadas. Uma delas amostra as log-intensidades de sua priori condicional, enquanto a outra é baseada no algoritmo iterativo de mínimos quadrados ponderados para modelos lineares generalizados mistos. Estes modelos se aplicam a arranjos espaciais pontuais nos quais a agregação dos eventos é devida à heterogeneidade espacial da intensidade do processo, sem a existência de correlação espacial direta entre eles. Um exemplo são os arranjos espaciais de casos de doenças não-contagiosas, que aparecem agregados porque a intensidade de ocorrência na região varia espacialmente como resultado das variações em características ambientais, sócio-econômicas ou outras que determinam o surgimento e crescimento da doença.
Palestrante: Marina S. Paez (IM-UFRJ)
Título:
Cox processes in time for point patterns and  their aggregations
Resumo
We propose a Cox process as a model for the temporal pattern of the incidence of cases of events of a certain type and develop associated methods of Bayesian inference, which we implement using an MCMC algorithm. For problems of this kind, the data may consist of the event-times themselves, or counts of the numbers of events in disjoint time-intervals. We explore the consequences of working with different levels of  temporal aggregation of the data. We use a simulated example to demonstrate the feasibility of our methodology, which we then apply to data giving daily counts of incident cases of gastrointestinal infections in the county of Hampshire, UK.

Palestrante: Glauco Valle (IM-UFRJ)

Título:
Estimativas e resultados de convergência para o modelo do votante
Resumo
Nós estudamos a evolução das interfaces para o modelo do votante em dimensão um, mostrando que se o núcleo do passeio aleatório associado com o modelo do votante tem momento de ordem superior a 3 finito então os extremos da interface convergem fracamente para um movimento Browniano em escala difusiva.

Palestrante: Antonio Ponce de Leon (IMS-UERJ)
Título:
Planejamento Ótimo de Experimentos para Modelos com Estrutura Complexa de Variância
Resumo
Nesta palestra alguns avanços recentes na teoria de planejamento ótimo de experimentos são apresentados. Vários métodos para obter experimentos ótimos para modelos com estruturas de variância e covariância simples bem como as propriedades destes experimentos já foram desenvolvidos ao longo das três ou quatro décadas. Portanto, a pesquisa na área tem sido no contexto de modelos com estruturas de variância mais complexas. Alguns  exemplos de soluções de problemas neste contexto serão discutidos. O primeiro consiste em experimentos ótimos para modelos lineares generalizados com espeficação conjunta da média e variância. A segunda referência está relacionada com experimentos com respostas observadas ao longo do tempo e mensuradas continuamente. Finalmente, o terceiro tema abordado consiste em experimentos com respostas multivariadas. Outros problemas similares serão mencionados ao final da palestra.

Palestrante: Ruben Klein (Cesgranrio/LNCC/MCT)
Título:
Avaliação e diagnósticos de desempenho
Resumo
Nesta palestra, introduziremos noções de avaliação de desempenho, análise de itens segundo a Teoria Clássica de Testes e a Teoria de Resposta ao item e a interpretação de uma escala de desempenho. Ilustraremos as análises com  exemplos.

Palestrante:  Teddy Seidenfeld (Carnegie Mellon University - EUA)
Título:
Multi-agent decision making and other settings for relaxing Bayesian theory
Resumo
I discuss why choice functions (that is, generalized decision rules) need to have at least a local Bayes model.  I provide a deFinetti-style standard of coherence (= avoiding uniform dominance) for choice functions generally, a result that has the broad scope found in Wald's Complete Class Theorems.  Second, I present a challenge for cooperative Bayesian partnerships, which serves to motivate the need to relax the canonical Bayesiantheory but without sacrificing coherence.  Last, I sketch a theory of coherent choice functions – which is work in progress -- as one way to meet thischallenge.
 

Palestrante:  Raquel Montes Diez (URJC - Espanha)
Título:
Bayesian Analysis of non-linear autoregression models based on neural networks
Resumo
In this paper, we show how Bayesian neural networks can be used for time series analysis. We consider a block based model building strategy to model linear and nonlinear features within the time series: a linear combination of a linear autoregression term and a  feedforward neural network(FFNN) with an unknown number of hidden nodes. To allow for simpler models, we also consider these terms separately as competing models toselect from. Model identifiability problems arise when FFNN sigmoidal activation functions exhibit almost linear behaviour, or when there are almostduplicate or irrelevant neural network nodes. New reversible jump moves are proposed to facilitate model selection mitigating model identifiability  problems. We illustrate this methodology analyzing several time series data examples.
 

2o. semestre de 2005
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

  • 07/12 Adriano Ferreti Borgatto (INE-UFSC) (Resumo)
    Título: Estimação Bayesiana para modelos de proporções e contagens com excesso de zeros

  • 23/11 José Ailton A. de Andrade (UnB) (Resumo)
    Título: Modelagem robusta bayesiana usando distribuições de variação regular

  • 09/11 Prévias de Mestrado (Resumos)

    • Valmária Rocha da Silva "Uma abordagem condicional para valores extremos multivariados: uma aplicação na modelagem dos níveis extremos de chuva" (Beatriz Vaz de Melo Mendes)
    • Carlos Henrique Azevedo Gomes "Estimação bayesiana com priori de Jeffreys em modelos de espaço de estados" (Marco A. R. Ferreira)

  • 26/10 Prévias de Mestrado (Resumos)
    • Ana Paula dos Santos Rubem (Beatriz Vaz de Melo Mendes)
    • Carla de Souza Lôbo: "Modelagem bayesiana de evolução de taxas de mortalidade. Estudo de caso:
      doenças do aparelho circulatório no RJ" (Helio S. Migon e Dani Gamerman)

  • 21/10 (Excepcionalmente 6a feira -13h - C116) Prévias de Mestrado (Resumos)
    • Marcus Vinicius M. Fernandes: "Modelos Espaço-Temporais Inflacionados de Zeros" (Alexandra M. Schmidt e Helio S. Migon)
    • Carolina P. Ornelas: "Modelos Bayesianos Semi-Paramétricos" (Alexandra M. Schmidt e Mariane B. Alves)

  • 28/09 Francisco Louzada Neto  (DE-UFSCar)(Resumo)
    Título: Uma Classe de Modelos de Riscos Não-Proporcionais Dependentes do Tempo 

  • 21/09 Denise Britz do Nascimento Silva (ENCE-IBGE) (Resumo)
    Título: Estimativas da Taxa de Desocupação para Pequenos Domínios via Modelos de Espaço de Estados

  • 26/08 Manuel Morales (York University/University of Montreal) (Resumo)
    Título: Generalized Risk Models, Levy Processes and the Discounted Penalty Function.

  • 10/08  Eugenio Caner, DSc. (Consultor Sênior Bayes Forecast) (Resumo)
    Título: Bayes Forecast - um novo enfoque em comercializar estatística.


1º semestre de 2005
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

  • 29/06   Rosemary Bailey (School of Mathematical Sciences, Queen Mary, University of London) (Resumo)
    Título:  Design of field experiments in the presence of interference between treatments. 
  • 22/06   Bruno Mendes (UCSC-EUA) (Resumo)
    Título:  A Bayesian solution to an inverse problem in groundwater contamination modeling.
  • 25/05   Tufi Machado Soares (UFJF) (Resumo)
    Título:  Aplicações de MCMC na estimação de modelos para a análise do comportamento diferencial do item.
  • 05/05   Carlos Alberto de Bragança Pereira (IME-USP) (Resumo)
    Título:  Significância Bayesiana
  • 27/04   Oswaldo G. Cruz (PROCC-Fiocruz) (Resumo)
    Título: Modelagem Espaço-Temporal dos homicídios região Sudeste/Brasil, 1979-1998.
  • 20/04   Sacha Friedli   (Resumo) (Concurso para Professor Visitante do DME-UFRJ)
    Título: Truncamento em Sistemas com Interações não-somáveis.
  • 13/04   Josemar Rodrigues - UFSCar (Resumo)
    Título: Bayesian Inference: A journey beyond normality, dependence and precise hypotheses
  • 23/03   Marc Suchard - UCLA, EUA (Resumo)
    Título: Statistical solutions to fundamental difficulties in evolutionary reconstruction models
  • 09/03   Dani Gamerman e Corpo Docente PG-Estatística
    Título: Apresentação do Programa de Pós-Graduação em Estatística do IM-UFRJ  aos novos alunos


Resumos das Palestras do 2º semestre de 2005:

Palestrante
:  Adriano Ferreti Borgatto (INE-UFSC)
Título: Estimação Bayesiana para modelos de proporções e contagens com excesso de zeros
Resumo
Neste trabalho, três modelos foram considerados para análise de um conjunto de dados obtido de um ensaio de controle biológico para Diatraea saccharalis, uma praga comum em plantações de cana-de-açúcar. Usando-se o modelo binomial, um ajuste adequado não pôde ser obtido, devido à superdispersão gerada pela variabilidade da média e pelo excesso de zeros. O segundo modelo foi o beta-binomial que leva em consideração a variabilidade da média e o terceiro foi o modelo beta-binomial inflacionado de zeros (ZIBB). Um outro conjunto de dados proveniente de um experimento para o controle de pragas na produção de milhos avaliados ao longo do tempo foi utilizado, sendo a variável resposta o número de lagartas. Neste caso, devido ao excesso de respostas zero, empregou-se o modelo Poisson inflacionado de zeros (ZIP), além do modelo Poisson padrão e devido aos dados serem observados ao longo do tempo incluiu-se o modelo ZIP com efeito aleatório. A estimação dos parâmetros dos modelos foi realizada através da abordagem Bayesiana, usando-se métodos de Monte Carlo com Cadeias de Markov (MCMC) e para a seleção dos modelos usou-se o fator de Bayes. A convergência da cadeia foi diagnosticada através da análise gráfica dos valores gerados e dos diagnósticos apropriados implementados no módulo CODA disponíveis no software R.

Palestrante:  José Ailton A. de Andrade (UnB)
Título: Modelagem robusta bayesiana usando distribuições de variação regular 
Resumo
Em grande parte dos modelos estatísticos as quantidades de interesse são os parâmetros de escala e de locação (ou alguma função desses). Neste trabalho nós estudamos modelos de locação e escala na presença de informações conflitantes. Em termos simples, dizemos que duas fontes de informação (por ex. dados e informação a priori) estão em conflito se elas carregam informações muito discrepantes sobre o mesmo parâmetro; em termos probabilísticos isso basicamente significa que as funções (verossimilhanças/densidades) que carregam informações sobre o parâmetro de interesse estão concentradas longe umas das outras. Veja O'Hagan e Forster (2004) para maiores detalhes. Quando esse problema ocorre, se modelarmos tradicionalmente (usando distribuições da familia exponencial), a distribuição a posteriori pode ser fortemente influenciada pela  informação conflitante, e potencialmente levar a conclusões erradas. A literatura sobre esse problema tem se concentrado em estabelecer  condições nas distribuições do modelo para que a distribuição a posteriori descarte automaticamente a informação que estaria causando o conflito. No entanto, essas condições propostas, além de serem difíceis de aplicar, têm se concentrado basicamente em modelos  de locação.  Neste trabalho, nós introduzimos a teoria de variação regular no contexto de modelagem robusta bayesiana, o que nos permite uma interpretação muito mais fácil de modelagem usando caudas pesadas. Como consequência, em modelos de locação e escala,  nós propomos condições suficientes nas distribuições do modelo que resultam na resolução do conflito rejeitando automaticamente a informação conflitante. Todas as formas de conflitos serão consideradas, isto é conflitos causados tanto pelos dados (outliers)  ou pela informação a priori. 

Prévias de Mestrado

Uma abordagem condicional para valores extremos multivariados: uma aplicação na modelagem dos níveis extremos de chuva
Valmária Rocha da Silva
A Teoria dos Valores Extremos Multivariados e seus métodos tratam da  caracterização, estimação e extrapolação das "caudas conjuntas" da distribuição multidimensional. As abordagens existentes são baseadas em argumentos limites em que todas as váriáveis são extremas. Iremos aplicar a proposta de um modelo multivariado para situações em que pelo menos uma das variáveis é extrema, desenvolvido  por Heffernan e Tawn, 2004. O cálculo correto das probabilidades dos eventos extremos ocorrem em diversas aplicações, a aplicação que consideramos aqui é em relação a riscos hidrológicos. Nós examinamos os níveis de três rios provocam inundações em Porto Rico,  os rios Fajardo, Canovanas e Espirito Santo, os quais monitoram as situações de enchente nessa região, durante o período de abril de 1967 a setembro de 2002, inclusive.

Estimação bayesiana com priori de Jeffreys em modelos de espaço de estados

Carlos Henrique Azevedo Gomes
Neste trabalho, desenvolvemos a priori de Jeffreys para a estimação Bayesiana em modelos espaço de estados. A priori de Jeffreys é obtida a partir da Matriz de Informação esperada de Fisher  (MI). Como em geral em modelos espaço de estados  MI  não possui uma forma analítica fechada a calculamos via filtro de Kalman como proposto em [CAVANAUGH & SHUMWAY, Statistics and Probability Letters 26 (1996) 347-355].  Calcular  MI,  no entanto, é muito demorado e por isso estudamos também a priori obtida substituindo-se  MI  pela matriz de informação observada de Fisher. A priori assim obtida pode ser considerada uma aproximação para a priori de Jeffreys. Consideramos vários estimadores Bayesianos, como a moda, a média e a mediana a posteriori, obtidos a partir dessas prioris e também, para efeito de comparação, da priori uniforme. Note que quando a priori uniforme é utilizada, a moda a posteriori coincide com o estimador de máxima verossimilhança. Comparamos para alguns casos particulares de modelos de espaço de estados a performance dos vários estimadores obtidos. Resultados preliminares indicam que o desempenho dos estimadores depende da razão sinal-ruído. Porém, de uma forma geral, o EMV é muito bom para estimar o estado latente no tempo inicial, enquanto que a média a posteriori com priori de Jeffreys é melhor para estimar as variâncias das pertubações.

Modelagem bayesiana de evolução de taxas de mortalidade. Estudo de caso: doenças do aparelho circulatório no RJ
Carla de Souza Lôbo
Atualmente, as doenças do aparelho circulatório são as principais causas de morte no Brasil. Entretanto, tem sido observado um declínio da mortalidade por  essas doenças. Nota-se que este declínio acontece de forma diferenciada para cada faixa etária da população, dependendo também do período considerado. A  modelagem do declínio destas taxas no Rio de Janeiro, no período de 1980 a  2002, para cada faixa etária, é o objeto deste estudo.  As análises se dividem em duas abordagens. A primeira é baseada no conceito do  fator de redução de mortalidade, utilizado por Renshaw e Haberman (2003), onde  modela-se o número de mortes como um modelo linear generalizado Poisson com sobredispersão. Na segunda abordagem, a força de mortalidade é avaliada  utilizando modelos de crescimento exponencial generalizados. Conceitos de modelagem dinâmica bayesiana serão empregados em ambas as abordagens.

Modelagem de valores extremos baseada nas r maiores estatísticas de ordem: Uma aplicação no cálculo do valor em  risco em mercadosemergentes

Ana Paula dos Santos Rubem
A
Teoria de Valores Extremos é um ramo da probabilidade que estuda o comportamento estocástico de extremos associados à uma distribuição F. Na prática, F  é desconhecida, tornando os cálculos exatos impossíveis. No entanto, sob certas suposições, o comportamento aproximado do máximo, ou mais geralmente, das r maiores estatísticas de ordem, é descrito por uma família de distribuições conhecida. As abordagens existentes em finanças são geralmente  baseadas  nos máximos e mínimos. Iremos aplicar o modelo para as r-maiores estatísticas de ordem proposto por Smith (1986), para o caso Gumbel, a partir dos desenvolvimentos teóricos de Weissman (1978), e generalizado por Tawn (1988), para avaliar a influência da inclusão das r-maiores estatísticas de ordem no cálculo de medidas de risco. Examinaremos os índices de cinco países que compõem o chamado mercado emergente, Argentina, Brasil, Chile, Índia e Singapura, no período de 31 de dezembro de 1993 a 31 de dezembro de 2005. A análise se divide em duas partes. Primeiro, iremos utilizar estimação por máxima verossimilhança e supor o vetor de parâmetros constante no tempo. Depois, iremos supor ser o vetor de parâmetros uma função suave no tempo, mas não-paramétrica, usando métodos de verossimilhança local como proposto por Heffernan et al (2004).
Modelos Bayesianos semi-paramétricos
Carolina P. Ornelas
Embora os modelos lineares generalizados sejam capazes de contornar o problema de não normalidade da variável resposta, ainda assim estes apresentam restrições. Uma delas reside no fato de que, em diversas situações, tem-se variáveis explicativas que não impactam a resposta média de forma linear. Além disso, para algumas variáveis o foco não está na estimativa dos efeitos das mesmas, mas apenas na consideração da possível existência destes efeitos.  A classe dos Modelos Aditivos Generalizados proposta por Hastie e Tibshirani (1990) permite que o preditor linear seja substituído por um preditor aditivo, composto pela soma de funções s quaisquer, sendo as funções suaves as mais indicadas.  O presente trabalho propõe-se a estudar uma forma de trabalhar com variáveis que são incorporadas de forma não-paramétrica no modelo. A abordagem de estimação utilizada é bayesiana e os modelos são ajustados a um conjunto de dados de mortalidade de São Paulo, com observações feitas no período de 01 de janeiro de 1994 a 31 de dezembro de 1997. Os resultados obtidos são comparados aos mesmos modelos ajustados segundo o enfoque clássico, e uma segunda aplicação é feita utilizando uma série mensal de chuva e vazão observada na bacia do Rio Grande (BA), no período de agosto de 1984 a setembro de 2004.

Modelos Espaço-Temporais Inflacionados de Zeros
Marcus Vinicius M. Fernandes
Este trabalho tem como objetivo modelar processos (fenômenos) que se caracterizam pela variação no tempo e no espaço e pela presença excessiva de zeros. Utiliza-se uma mistura de distribuições, incluindo massa de probabilidade no ponto 0
(zero). Serão abordados modelos para variáveis contínuas (exponencial, gama, log-normal) e discretas (poisson), utilizando processos gaussianos e efeitos autoregressivos condicionais (CAR), no âmbito da dependência espacial. É adotada a abordagem bayesiana, com a utilização de métodos de Monte Carlo via Cadeia de Markov (MCMC). Aplicaremos o(s) modelo(s) a dados de chuva da cidade do Rio de Janeiro, para variávies contínuas e dados de dengue, também da cidade do Rio de Janeiro, para variáveis discretas. Ao final do estudo é feita a modelagem conjunta de dengue e chuva, examinando o excesso de zeros em ambos os casos.
Palestrante:  Francisco Louzada Neto (DE-UFSCar)
Título: Uma Classe de Modelos de Riscos Não-Proporcionais Dependentes do Tempo
Resumo
Neste seminário discutimos uma nova família paramétrica de modelo de risco não-proporcional dependente do tempo (McKenzie, 1999). O modelo é baseado na generalização da função logística usual e é motivado, em parte, pela necessidade de se considerar o efeito do tempo na modelagem, e, em parte, pela preferência em se considerar uma estrutura paramétrica para a função de risco. Vários procedimentos inferenciais relacionados a esta nova família de modelos são apresentados.

Palestrante:  Denise Britz do Nascimento Silva - IBGE
Título: Estimativas da Taxa de Desocupação para Pequenos Domínios via Modelos de Espaço de Estados
Resumo

O Instituto Brasileiro de Geografia e Estatística – IBGE enfrenta constantemente o desafio de produzir estimativas com alto nível de precisão para pequenos domínios ou áreas. Pequenos domínios são aqueles para os quais não se consegue obter estimativas para os parâmetros de interesse, com a precisão adequada, através de procedimentos tradicionais de amostragem. Este trabalho tem por objetivo desenvolver modelos de séries temporais para estimação em pequenos domínios em pesquisas amostrais repetidas. A série utilizada neste trabalho é proveniente da Pesquisa Mensal de Emprego – PME, no período de janeiro de 2000 a fevereiro de 2005. O método foi desenvolvido para fornecer estimativas da taxa de desocupação, por sexo, sob a restrição de que as estimativas obtidas sejam compatíveis com a taxa de desocupação referente ao total da população publicada pelo instituto (benchmarking).

Palestrante:  Manuel Morales (York University/University of Montreal)
Título:Generalized Risk Models, Levy Processes and the Discounted Penalty Function.
Resumo
We will review, from a historical point of view, the use of Levy processes in ruin theory. We focus on the decomposition for the ruin probability and we argue how its convolution structure is inherited from the Levy family of  processes. We will discuss the notion of discounte penalty function in the framework of Levy risk processes. The problem of finding expressions for this function in a risk model driven by a Levy process will be addressed. Examples for which these expressions are available will be discussed. Expressions for the joint density of the process prior and at ruin are presented for a few examples. These include the gamma process and the inverse Gaussian process. Finally, forms of the discounted penalty function in a more general setting will be discussed.


Palestrante:  Eugenio Caner, DSc.
Título: Bayes Forecast - um novo enfoque em comercializar estatística
Resumo
A palestra apresentará a empresa Bayes Forecast que está iniciando suas operações no Brasil. A Bayes Forecast, é uma empresa de Business Intelligence Quantitativo, especializada no desenvolvimento de sistemas de previsão, atenção e monitoramento da demanda,  gestão dos investimentos de publicidade entre outras aplicações.  Tratará sobre  histórico, sua identidade, o enfoque de comercializar seus serviços, sua filosofia de modelagem aberta e ferramentas open source. Abordaremos algumas das soluções implementadas em seus clientes e também as perspectivas de contratação de profissionais de estatísticas.




Resumos das Palestras do 1º semestre de 2005:

Palestrante
:  Rosemary Bailey
Título: Design of field experiments in the presence of interference between treatments.
Resumo
In many types of field experiment it is likely that the treatment applied to one plot will affect neighbouring plots as well as the plot  to which it is applied.  Such an effect is variously called a  neighbour effect, or interference between treatments, or competition  between treatments.   Where such effects exist, we need not only to model them in the analysis but also to design the experiment with the neighbour effects in mind.  This talk will give examples from various  different types of treatment, discuss  some of the issues, and give  some recommendations for design, some derived theoretically,  some more ad hoc.


Palestrante
:  Bruno Mendes
Título: A Bayesian solution to an inverse problem in groundwater contamination modeling.
Resumo
In this work we use Bayesian methods to solve a parameter estimation (inverse) problem in groundwater contamination. The problem consisted of estimating the values of water velocity and dispersion parameters of an analytical solution to an advection-dispersion differential equation. Following standard practice in this field, this equation was assumed to provide a good mathematical description of the groundwater system relevant to our work. The experimental data were obtained by a tracer experiment which consisted in a two-well recirculation tracing test, and was performed using an extraction-injection well couplet. Previous work in this field has largely been confined to the use of maximum-likelihood techniques, which depend upon large-sample approximations to provide measures of uncertainty for parameter estimates. We pose the inverse problem in a Bayesian framework: we use diffuse prior distributions and the values of observed tracer concentrations versus time to obtain posterior distributions for the parameters of interest, employing Markov chain Monte Carlo simulation techniques to explore the posterior distributions for the parameters. Our principal finding is that, even with appropriate uncertainty bands on all of the relevant parameters, the standard advection-dispersion differential equation used in this field to model groundwater systems like the one we studied is inadequate to fit the observed data. This work demonstrates that Bayesian methods can produce highly informative results in the field of groundwater contamination modeling.


Palestrante:  Tufi Machado Soares
Título: Aplicações de MCMC na estimação de modelos para a análise do comportamento diferencial do item.
Resumo
Será apresentado um resumo dos principais métodos para estimação dos parâmetros dos modelos da teoria da Resposta ao item. Em seguida, será  introduzido o problema do comportamento diferencial do Item e serão apresentados sucintamente os principais métodos de detecção. Finalmente,  propõe-se modelos hierárquicos para a detcção e, ou, a confirmação do  comportamento diferencial apresentado por um mesmo conjunto de itens  associados a um mesmo tema. Indicam-se abordagens possíveis, baseadas em  MCMC, para a estimação desses modelos.


Palestrante
:  Carlos Alberto de Bragança Pereira
Título: Significância Bayesiana
Resumo
(Resumo extraído do Relatório Técnico IME-USP MAE 05/15 Pereira, Stern e Weshler (2005) "Can a significance test be genuinely Bayesian?" )
This paper reviews of the Full Bayesian Significance Test, FBST. The original and the invariant versions of the FBST evidence values are discussed in detail and compared with alternative procedures: Neyman-Pearson-Wald based p-values and Bayes factor based posterior probabilities. Three standard statistical problems, independence in contingency tables, Behrens-Fisher, and variable selection in linear egression, are used to illustrate the FBST advantages and versatility.

Palestrante:  Oswaldo G. Cruz
Título: Modelagem Espaço-Temporal dos homicídios região Sudeste/Brasil, 1979-1998.
Resumo
Neste trabalho analisamos aspectos temporais, espaciais e espaço-temporais dos homicídios ocorridos nos municípios da Região Sudeste do Brasil, nos anos de 1979 a 1998. Diversos tipos de técnicas foram utilizadas, tais como modelos de series temporais, analise espacial, e analise exploratória espaço temporais utilizando animação de mapas e superficies. Também foram utilizados modelos GAMM bayesianos com extensão espaço temporais. O emprego dessas múltiplas técnicas permitiu observar  a tendência crescente dos homicídios na região sudeste e seu espalhamento ao longo do período estudado. Os modelos também evidenciaram mais de um tipo de processo espaciais e temporais ocorrendo nos estados da Região Sudeste.


Palestrante
:  Friedli Sacha
Título: Truncamento em Sistemas com Interações não-somáveis.
Resumo
A existência de transicoes de fases eh bem definida, no  padrao da mecanica estatistica, para sistemas cujas interacoes sao  SOMÁVEIS. Para tais sistemas, a ocorrencia de transicoes de fases depende fortemente da temperatura. Quando as interações são não- somáveis, essa dependência é trivial, e nós vamos mostrar que o  sistema sempre pode ser truncado. Isto é, consideremos um modelo  ferromagnetico onde todas as interações entre partículas afastadas  de mais de N unidades são desprezadas. Para qualquer temperatura T,   acontece o seguinte: quando N vai para o infinito, as medidas de  Gibbs do sistema em equilíbrio (de temperatura T) convergem  fracamente para as medidas de Dirac associadas aos estados  fundamentais do sistema. Quer dizer: o modelo truncado sempre tem  transição de fase quando N eh grande o suficiente. Esse resultado,  cuja prova usa metodos de percolacao, mostra que sistemas de longo  alcance nao-somaveis tem comportamento termodinamico trivial.


Palestrante:  Josemar Rodrigues - UFSCar
Título: Bayesian Inference: A journey beyond normality, dependence and precise hypotheses
Resumo
Lately, there has been an increasing interest in finding more flexible and realistic models and evidence measures to represent adequately as possible the features of the data. In this conference we review recent developments in Bayesian Inference based on skew-normal distributions, entropy for modelling dependent variables and evidence test for precise hypotheses. The skew-normal distribution ,which includes the uni-variate normal distribution as a special case , can be exploited in Bayesian analysis both for modelling prior beliefs and asymmetric observations. The book recently edited by Genton (2004) shows a collection of applications in different areas. In this conference, a new extended skew-measurement error model is introduced with application on real data via Winbugs. Some basic concepts of the Maxent theory are presented in order to characterize the association among variables observed in the same individual (called "frailty entropy") and an application on real recorrent data is also considered. Finally, the conference is ended by introducing a "fully " Bayesian method for precise hypotheses (Pereira and Stern, 1999) to compute the evidence of the Poisson distribution against the Zero-In‡ated Poisson distribution (ZIP). This measure is intuitive and easy to implement via Winbugs as an alternative to the classical p-value tests.


Palestrante
:  Clarice Demétrio - ESALQ-USP
Título: An Overview of Overdispersion
Resumo
This talk will provide a treatment of overdispersion in generalized linear models, present a survey of the commonly used models, discuss general ideas of estimation and inference and consider the practical application of the methods in applied statistics. Applications will be drawn from biometry, biostatistics and social science.

Palestrante:  Marc Suchard - UCLA, EUA
Título: Statistical solutions to fundamental difficulties in evolutionary reconstruction models
Resumo
Genomics research is generating vast molecular sequence data ranging from single genes to whole genomes across an increasing number of species. However, fundamental difficulty in evolutionary studies emerges as the availability of sequences expands.  Phylogenetics methods to reconstruct the evolutionary tree relating the sequences traditionally condition on a single, sometimes poorly estimated sequence alignment, where an alignment specifies which residues in the sequences derive from a common origin.  This conditioning can cause bias and inappropriate infer in genomic studies, particularly when the sequences are highly diverse. For example, the early branching-order of Bacteria, Archaea and Eukaryotes, the three major domains of life, is troublesome to determine. As a solution, I describe a novel Bayesian model for simultaneously estimating alignments and the phylogenetic trees that relate the sequences. This sidesteps the bias issue inherent in sequential estimation. Joint estimation also allows one to model rate variation between sites when estimating the alignment and to use the evidence in shared insertion/deletions (indels) in the sequences to group sister species in the tree. I base this indel process on a Hidden Markov Model that makes use of affine gap penalties and considers indels of multiple residues. I develop a Markov chain Monte Carlo (MCMC) method to sample from the posterior of the joint model, estimating the most probable alignment and tree and their support simultaneously. I describe a new MCMC transition kernel based on the Forward-Backward algorithm and a careful choice of parameter marginalization that improves our algorithm's mixing efficiency, allowing the MCMC chains to converge even when started from arbitrary alignments. Finally, my software implementation can estimate alignment uncertainty and I describe a method for summarizing this uncertainty in a  single plot.
 

Palestrante
:  Hedibert Freitas Lopes - GSB, University of Chicago  
Título: Time-varying variances through copulas
Resumo
It is well known that financial volatilities move frequently together through time and
then, it is important to find appropriate models to understand and predict the temporal
dependence in multivariate high-frequency data.  Although widely used, the correlation
matrix is not a well measure of dependence when normality assumptions do not hold and
it can be misleading for financial investors.  

Copula is one of the most promising tools to describe the dependence between random
variables. The main idea behind copula is to separate the marginal behaviour and
dependence structure from joint distribution.   Previous works using copulas in dynamic
models does not account for the parameter uncertainty simultaneously. Proposed methods
use 2-steps ML approaches which lead to consistent but not efficient estimators.  
We propose a Bayesian fully analysis that simultaneously access posterior uncertainty
for the parameters of the marginals and the parameters of the dependence structure
defined by a copula function. 


2º semestre de 2004

As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

   
  • 01/12   Friedli Sacha - IMPA-RJ (Resumo)
    Título: Truncamento em percolação de longo alcance. 
  •  
  • 17/11  Marcelo Viana - IMPA-RJ
    Título: Estabilidade estocástica de sistemas dinâmicos.  (Resumo)
  •  
  • 03/11 (Excepcionalmente às 15h) Caio Ibsen Rodrigues de Almeida - IBMEC-RJ
    Título: Affine Processes, Arbitrage-Free Term Structures of Legendre Polynomials and Option Pricing.  (Resumo)
  •  
  • 20/10 Fernando Moura -  DME-UFRJ
    Título:  Small Area Estimation Under Different Boundary Systems via Low Level Modelling (Resumo)
  •  
  • 06/10 (Excepcionalmente às 15h)  Defesa da Primeira Tese de Doutorado do Programa de Pós-Graduação do DME-UFRJ
    • Marina Paez  -  DME-UFRJ
      Título:  Análise de modelos para a estimação e previsão de processos espaço-temporais  (Resumo)
    •  
  • 24/09 (Excepcionalmente 6ª feira as 15h) Petar M. Djuric - Stony Brook University NY, USA
    Título: New developments in the theory and practice of particle filtering (Resumo
  •  
  • 08/09 Luiz Renato Lima - FGV-RJ
    Título: Testing Unit Root Based on Partially Adaptive Estimation.  (Resumo)
  •  
  • 25/08 Cristiane Duarte - DME-UFRJ
    Título: Uma Análise Bayesiana para Dados Educacionais (Resumo)
  •  
  • 18/08 Hedibert Freitas Lopes - GSB-University of Chicago / DME-UFRJ
    Título:  Bayesian Factor Models in Financial Econometrics  (Resumo)
 

1º semestre de 2004
As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

 
  • 30/06 Heleno Bolfarine - IME-USP
    Título: Modelos assimétricos normais para modelos com variáveis latentes (Resumo)

  • 23/06 Paulo Justiniano - UFPR
    Título: Avaliando a evolução da Morte Súbita dos Citrus (Resumo)

  • 09/06 João Victor Issler - FGV - RJ
    Título: Using Common Features to Construct a Preference-Free Estimator of the Stochastic Discount Factor (Resumo) - Download do paper

  • CANCELADA - 04/06 (Sexta Feira) - Byron Morgan, Institute of Mathematics and Statistics,University of Kent, Canterbury.
    Título: Models for yeast prions (Resumo)

  • 19/05 - Jorge P. Zubelli - IMPA
    Título: O Impacto da Matemática em Biociências (e Vice-Versa): Exemplos e Desafios em Tomografia e Microscopia Eletrônica Tri-Dimensional. (Resumo)

  • 12/05 - Márcia D´Elia Branco e Cristian Luis Bayes Rodriguez - IME-USP
    Título: Problemas de Inferência na distribuição normal assimétrica. (Resumo)

  • 28/04 - Jorge Washington Silva Bhering -
    Título: Simulação Estocástica Aplicada em Plano de Contribuição Definida. (Resumo)

  • CANCELADA - 14/04 - Francisco Louzada-Neto, Departamento de Estatística - UFSCar
    Título: Bayesian Estimation of the Disease Prevalence and Performance Measures of Diagnostic tests in the Presence of Latent Gold Standard.(Resumo)

  • 31/03 - Edgar Acuña , Department of Mathematics, University of Puerto Rico
    Título: Feature selection methods in supervised classification.(Resumo)

  • 24/03 - Cibele Queiroz da Silva, Departamento de Estatistica - ICEx - UFMG
    Título: Modelos Markovianos com Estados latentes aplicados a uma subsequência do genoma da Xylella fastidiosa.(Resumo)

  • 12/02 (as 10:30) - Jim Zidek, University of British Columbia
    Título: Uncertainty and Information. (Resumo)
 
Resumos das Palestras

Palestrante:  Friedli Sacha - IMPA-RJ
Título: Truncamento em percolação de longo alcance. 
Resumo
O fenômeno de percolação é a presença quase certa, em grafos aleatórios, de aglomerados de tamanho infinito. Em geral, nós estudamos grafos aleatórios cujos pontos são pontos do plano com coordenadas inteiras, e onde existe uma conexão entre dois pontos com uma certa probabilidade (dependendo da distância). Pontos são conectados entre si de modo independente. Dizemos que o sistema percola quando existe, em tal grafo aleátorio, um aglomerado de tamanho infinito.
O problema do truncamento é o seguinte. Suponhamos que o sistema percola. Será que existe um numero N (grande) tal que o novo grafo obtido, apagando todos as conexões de tamanho maior do que N, ainda percola?

Palestrante: Marcelo Vianna - IMPA-RJ
Título: Estabilidade estocástica de sistemas dinâmicos
Resumo
Dizemos que um sistema dinâmico é estável se o seu comportamento permanece "essencialmente o mesmo" quando a lei de evolução é ligeiramente modificada.
Em aplicacoes práticas é fundamental saber que o modelo utilizado é de fato estável, porque se trata sempre de uma aproximação do sistema real. Para tornar a idéia de estabilidade uma definição matemática, precisamos explicar o que entendemos por "essencialmente o mesmo".  O ponto de vista estocástico, devido a Kolmogorov, propõe focalizar dados de tipo estatístico, tais como as médias temporais de grandezas observáveis, e analisar como esses dados são afetados quando o sistema é sujeito a pequeno ruído aleatório. Falamos de estabilidade estocástica se as médias temporais correspondentes ao sistema com ruído estão próximas daquelas que correspondem ao sistema inicial não perturbado. As demonstrações rigorosas de estabilidade estocástica são quase sempre difíceis, e a teoria permanece bastante incompleta. Mas tem havido um bom número de resultados recentes nesta área e começa a desenhar-se a perspectiva de que grandes classes de sistemas dinâmicos são estáveis.


Palestrante:  Caio Ibsen Rodrigues de Almeida - IBMEC-RJ
Título: Affine Processes, Arbitrage-Free Term Structures of Legendre Polynomials and Option Pricing.
Resumo
Modelos Afins multi-variados para a estrutura a termo da taxa de juros tem sido utilizados com grande frequência no apreçamento de derivativos de renda fixa. Nestes modelos, a incerteza é gerada por um vetor de espaço de estados, sendo a taxa de juros de curto prazo uma função afim de tal vetor. O modelo é caracterizado por uma forma específica de Equação Diferencial Estocástica (EDE) para a evolução do vetor de estados, que impoe restrições de não-arbitragem sobre tal modelo.  Neste paper resolvemos o seguinte problema inverso: Suponha que a estrutura a termo da taxa de juros é modelada por uma combinação linear de Polinômios de Legendre com coeficientes estocásticos. Pergunta: Existe então uma EDE para estes coeficientes que garanta ausência de arbitragem no mercado? Do ponto de vista prático, obtemos tais EDEs sob diferentes circusntâncias e apresentamos alguns exemplos de apreçamento de opções, e outros ativos de renda (DIs do mercado brasileiro).



Palestrante: Fernando Moura - DME-UFRJ
Título: Small Area Estimation Under Different Boundary Systems via Low Level Modelling
Resumo
The main objective is to develop a model based estimation  methodology that is sufficiently flexible to accommodate a variety  of boundary systems. The strategy considered here is to model the  data at a very low geographical level and build the estimation at  any desired level by aggregation. We develop a methodology for estimating at varying and not necessary compatible boundary systems  and obtain precision measures for any desired boundary system that  can be obtained by low level aggregation. In order to investigate  the adequacy of the proposed methodology, we show and discuss the  results of a small simulation study.


Palestrante: Marina Paez - DME-UFRJ
Título: Análise de modelos para a estimação e previsão de processos espaço-temporais
Resumo
Nesse trabalho analisamos observações feitas no espaço e/ou tempo que apresentam estrutura de correlação nessas dimensões, usando para isso modelos que levam em consideração essa dependência, e tendo como objetivo fazer previsões para tempos futuros e interpolação espacial. Para tratar a variação espaço-temporal, propomos modelos hierárquicos que incorporam uma estrutura de correlação temporal e ou espacial na média (condicional aos processos explicativos) da variável resposta, e nos casos onde existe considerável heterogeneidade espacial no efeito de processos explicativos, incorporam também uma estrutura de correlação no tempo/espaço nos coeficientes relativos a esses processos. Tendo como base os modelos dinâmicos (para tratar variação temporal) e os campos aleatórios gaussianos (para tratar variação espacial), e trabalhando sob o ponto de vista Bayesiano, propomos três diferentes modelagens para dados temporais ou espaço-temporais. A primeira proposta é uma extensão dos modelos usados em Paez e Gamerman (2003), onde permitimos que os coeficientes das covariáveis variem no espaço, e estudamos os efeitos da incorporação de incertezas no modelo. A segunda proposta é uma generalização da primeira, onde os parâmetros associados às variáveis resposta variam no tempo e no espaço. Essa modelagem é um caso particular dos modelos dinâmicos hierárquicos matriz-variados propostos por Landim e Gamerman (2000) para respostas gaussianas multivariadas, onde impomos uma forma estruturada para as matrizes de variância espacial. A terceira e última proposta é um estudo da variação temporal da incidência de eventos através de processos de Cox log-gaussianos, baseado no artigo de Brix e Diggle (2001).

Palestrante: Petar M. Djuric - Stony Brook University NY, USA
Título: New developments in the theory and practice of particle filtering.
Resumo
In the past decade, particle filtering has attracted much attention of engineers and scientists. It is used in problems where observed data are described by state-space models that contain nonlinear equations and where the noise is possibly non-Gaussian. Particle filtering is based on random grids whose nodes are called particles and where the nodes have weights that account for their importance. The particles and the weights form random measures, which approximate the distributions of the unknowns. In this presentation, first some of the basics of particle filtering will be provided followed by a description of some new developments and challenges in its theory and practice. Examples will include use of particle filters for tracking in wireless sensor networks.

Palestrante: Luiz Renato Lima - FGV-RJ
Título: Testing Unit Root Based on Partially Adaptive Estimation.
Resumo
This paper proposes unit root tests based on partially adaptive estimation. The proposed tests provide an intermediate class of inference procedures that are more efficient than the traditional OLS-based methods and simpler than unit root tests based on fully adaptive estimation using nonparametric methods. The limiting distribution of the proposed test is a combination of standard normal and the traditional Dickey-Fuller (DF) distribution, including the traditional ADF test as a special case when using Gaussian density. Taking into account the well documented characteristic of heavy-tail behavior in economic and financial data, we consider unit root tests coupled with a class of partially adaptive M-estimators based on the student-$t$ distributions, which includes the normal distribution as a limiting case. Monte Carlo Experiments indicate that, in the presence of heavy tail distributions or innovations that are contaminated by outliers, the proposed test is more powerful than the traditional ADF test. We apply the proposed test to several macroeconomic time series that have heavy-tailed distributions. The unit root hypothesis is rejected in U.S. real GNP, supporting the literature of transitory shocks in output. However, evidence against unit root is not found in real exchange rate and nominal interest rate even when haevy-tail is taken into account.


Palestrante: Cristiane Duarte - DME-UFRJ
Título: Uma Análise Bayesiana para Dados Educacionais
Resumo
Apresentamos uma análise Bayesiana a respeito da performance de alunos do ensino fundamental da rede municipal do Rio de Janeiro em uma prova de  matemática tendo como referência suas características pessoais, a formação do professor, efeitos da turma e da escola, e tipo de questões que compõem a prova. O nosso objetivo é identificar as dificuldades de aprendizado inerentes ao aluno e quantificar os efeitos positivos e negativos que podem  impactar na qualidade do ensino. São aplicados modelos Bayesianos incluindo efeitos espaciais e efeitos específicos referentes ao nível de dificuldade das questões da prova de matemática. No modelo são incluídas ao nível do aluno variáveis específicas deste, ao nível da turma variáveis específicas do professor e ao nível da escola efeitos espaciais para captar a influência de variáveis sócio-econômicas não disponíveis diretamente. Incluindo estes efeitos espaciais, assumimos implicitamente que escolas geograficamente  próximas tem variáveis sócio-econômicas similares. Os resultados desta análise podem ser utilizados na definição de estratégias e políticas educacionais, visando em última instância a melhoria do ensino-aprendizagem da Matemática. Com esta análise Bayesiana podemos inferir quais variáveis específicas impactam mais na performance dos alunos, além de obter um mapa dos efeitos espaciais e assim definir as regiões do município que devem receber mais atenção na melhoria do ensino da matemática.


Palestrante: Hedibert F. Lopes - GSB-University of Chicago / DME-UFRJ
Título:  Bayesian Factor Models in Financial Econometrics
Resumo
We review in depth and breadth the use of factor analysis in structuring covariances in multivariate financial time series models.  In the first part of the talk, we introduce the traditional static factor model and discuss parametrization and identification issues as well as frequentist and Bayesian inference when the number
of factors is kept fixed.  We then present Lopes and West's (2004) Reversible Jump MCMC that deals with uncertainty associated to the number of factors and Lopes's (2003) study on prior robustness.  Time-varying covariance models are reviewed in the second part of the talk, when factor stochastic volatility and factor-ARCH like models are extensively discussed and compared.  Lopes and Migon's (2002) study on financial contagion in Latin America is discussed.  The talk finishes with the introduction of a new class of time-varying covariance models: The Time-Varying Cholesky Decomposition Model of McCullogh, Lopes and Tsay (2004).  The previous models are compared to the our new model in a trivariate financial time series applications comprising the North American, the Brazilian and
the Mexican market indexes.

Palestrante: Heleno Bolfarine - IME-USP
Título: Modelos assimétricos normais para modelos com variáveis latentes
Resumo
Consideramos expressões analíticas para as funções de verossimilhanças no modelo linear com erros nas variáveis e no modelo com efeitos aleatórios. Dada a complexidade da função de verossimilhança consideramos um algoritimo do tipo EM para a estimaçao dos parâmetros do modelo.

Palestrante: Paulo Justiniano - UFPR
Título: Avaliando a evolução da Morte Súbita dos Citrus
Resumo
A Morte Súbita dos Citrus (MSC) é uma doença qua atinge certas combinações de enxerto/porta-enxerto em árvores de citrus já afetando parte da principal região citrícola brasileira e com potencial de espalhamento nos próximos anos. A doença foi detectada pela primeira vez em 1999 e descrita em 2001. O agente causador ainda não está determinado embora evidências apontem para uma variação do vírus da Tristeza dos Citrus.
Dada a situação atual de alto risco e potencial prejuízo a doença tem sido foco de atenção por porte dos orgãos ligados a produção de citrus. Diversos levantamentos de dados e estudos tem sido realizados a fim de compreender melhor os padrões de dispersão espacial da doença tanto a pequena escala em talhões, quanto na larga escala, na região produtora.
Nesta apresentação descreve-se o problema e as questões de relevância científica e estatística associadas. Resultados obtidos até o momento serão apresentados e serão discutidas estratégias para futuras análises.

Palestrante: João Victor Issler - FGV-RJ
Título: Using Common Features to Construct a Preference-Free Estimator of the Stochastic Discount Factor
Resumo
We propose a novel estimator for the stochastic discount factor (SDF) in a panel-data context. Under general conditions it depends exclusively on appropriate averages of asset returns, and its computation is a direct exercise, as long as one has enough observations to fit our asymptotic results. We identify the SDF using the fact that it is the "common feature" in every asset return of the economy. Moreover, it does not depend on any assumptions about preferences, or on consumption data, which allows testing directly different preference specifications, as well as the existence of the equity-premium puzzle. Preliminary results are encouraging.

Palestrante: Byron Morgan, Institute of Mathematics and Statistics,University of Kent, Canterbury.
Título: Models for yeast prions.
Resumo
In this talk I shall describe current joint research with Martin Ridout and Diana Price (Statistics, Kent), Mick Tuite and Lee Byrne (Biosciences Kent) and Lloyd Ruddock (Biosciences, Finland). We are motivated by experiments at Kent, designed to estimate the mean number, m, of prions in yeast cells. The work has important consequences for understanding both prion behaviour and the basic mechanisms taking place within living cells. The seminar assumes no previous knowledge of the biological setting, and the essence of the seminar involves elementary probability theory and model-fitting. The yeast protein Sup35p exists in two stable forms, giving rise to phenotypes [PSI+] and [psi-], distinguished by a colour assay. Because it replicates in a manner similar to the mammalian prion PrP, Sup35p is called a yeast prion. When the chemical GuHCl is added to a culture medium growing [PSI+] cells, the proportion of [PSI+] cells gradually decreases over time, because of inhibition of prion replication: the number of prions present initially is gradually diluted through an expanding population of yeast cells. The experimental data provide estimates of the proportion of [PSI+] cells at hourly intervals. We develop stochastic models for this process, and obtain an interesting analytical solution when cell doubling time is assumed to be constant, but not synchronised between cells. We then use a more realistic model that allows for variation in doubling time. Our estimate of m ~ 100 is substantially larger than a previously published estimate. Other parameters in the model include the mean, n, of cell doubling time and a time lag parameter that allows for disruption to cell doubling at the start of the experiment. Our estimates of n agree closely with independent estimates from optical density (OD) measurements. OD data are also used to distinguish between alternative estimates of the time lag that give almost equivalent fits to the data. Model extensions which incorporate greater biological realism, will also be described.

Palestrante: Jorge P. Zubelli - IMPA
Título: O Impacto da Matemática em Biociências (e Vice-Versa): Exemplos e Desafios em Tomografia e Microscopia Eletrônica Tri-Dimensional.
Resumo
Nas últimas décadas a tomografia computadorizada tem permitido avanços surpreendentes em diversas áreas de medicina. Do ponto de vista de desenvolvimento científico isso se deve a um tremendo esforço de integração interdisciplinar. Nesta palestra pretendo inicialmente fazer um breve apanhado das ferramentas matemáticas que permitiram a tomografia se tornar uma realidade, bem como alguns dos problemas matemáticos suscitados pela mesma. A seguir discutirei algums dos desafios matemáticos encontrados pelo imageamento de tecidos com infra-vermelho e pela microscopia eletrônica tri-dimensional de macro-moléculas.

Palestrante: Márcia D´Elia Branco e Cristian Luis Bayes Rodriguez - IME-USP
Título: Problemas de Inferência na distribuição normal assimétrica.
Resumo
No presente trabalho discutimos o problema da estimação via máxima verossimilhança para o parâmetro de assimetria da distribuição normal assimétrica univariada (Azzalini, 1985) e apresentamos alternativas Bayesianas bastante eficientes para estimação desse parâmetro. Uma aplicação em modelos de regressão linear com erros nas variáveis será discutida, enfatizando a estrutura hierárquica do modelo.

Palestrante: Jorge Washington Silva Bhering -
Título: Simulação Estocástica Aplicada em Plano de Contribuição Definida.
Resumo
Planos de Contribuição Definida geram benefícios de aposentadoria, em regime individual, que dependem do montante obtido na aplicação das contribuições vertidas por seus participantes. A técnica usualmente adotada para a projeção das rendas de aposentadoria consiste na aplicação de modelos determinísticos. Após a concessão do benefício, a responsabilidade das entidades é dimensionada exclusivamente em função do valor esperado do fluxo de pagamentos. Como alternativa propõe-se a aplicação de modelos estocásticos no contexto de planos de contribuição definida em duas etapas: a) acumulação de recursos; e b) pagamento de benefícios. Na primeira etapa é apresentado um modelo de acumulação estocástico, orientado por uma política de macro alocação atrelada à meta sob o princípio de otimalidade de Bellman. Na segunda, a distribuição dos compromissos da entidade é simulada a partir da distribuição dos compromissos individuais de cada um de seus participantes que estejam em gozo de benefício de renda de aposentadoria.

Palestrante:Francisco Louzada-Neto, Departamento de Estatística - UFSCar
Título:Bayesian Estimation of the Disease Prevalence and Performance Measures of Diagnostic tests in the Presence of Latent Gold Standard.
Resumo
In this seminar we present a Bayesian analysis for estimating the disease prevalence, the sensitivity and specificity of several independent diagnostic tests in the presence of a covariate and latent gold standard. We use Metropolis-Hastings algorithm to obtain the posterior summaries of interest. The methodology can be easily extended to the case with two or more covariates or more than two tests. With only two diagnostic tests we can not perform a maximum likelihood procedure since the number of unknown parameters is bigger than the number of observations. Under the Bayesian approach we overcome this problem by introducing latent variables. An application to a real medical data illustrates the methodology.

Palestrante: Edgar Acuña, Department of Mathematics, University of Puerto Rico
Título:Feature selection methods in supervised classification
Resumo
In this talk we will present an empirical comparison of filter and wrapper procedures for supervised classification. The filter methods considered are: Relief, Las Vegas Filter (LVF), and FINCO, a new method introduced by us. Among the wrappers considered are: The sequential forward selection (SFS) and the sequential floating forward selection (SFFS). The classifiers used by the wrappers are: The linear discriminant analysis (LDA), The k-nearest neighbors (KNN) classifier and a decision tree classifier based on recursive partition (Rpart). Both type of feature selection procedures are compared on the percentage of selected features as well as on their effect on the misclassification rate of the classifiers. Finally, we compare our results with feature selection using Random Forest. The experiments are carried out in twelve datasets coming from the Machine Learning Database Repository available at the University of California, Irvine.

Palestrante: Cibele Queiroz da Silva, Departamento de Estatística - UFMG
Título:Hidden Markov models applied to a subsequence of the Xylella fastidiosa genome
Resumo
Dependencies in DNA sequences are frequently modeled using Markov models. However, Markov chains cannot account for heterogeneity that may be present in different regions of the same DNA sequence. Hidden Markov models are more realistic than Markov models since they allow for the identification of heterogeneous regions of a DNA sequence. In this work we present an application of hidden Markov models to a subsequence of the Xylella fastidiosa DNA data. We found that a three-state model provides a good description for the data considered.

Palestrante: Jim Zidek, University of British Columbia
Título:Uncertainty and Information
Resumo
"Uncertainty", like its complementary cousin, "information", is a much used but not very well defined concept despite its intrinsic role in statistics. (Indeed, that latter is often described as the "science of uncertainty".) In this talk, I will explore some of the meanings provided in a paper, written with Constance van Eeden, that are ascribed to that term and readily discover that seemingly natural questions can have answers that are either elusive or counter-intuitive. For example, surprisingly (in answer to one of those questions), the level of uncertainty (according to one defintion) can actually increase rather than decrease as the amount of information increases. For other definitions we have not been able to give general answers to that question. I will also address the issue of combining information to reduce uncertainty. Specifically, I will survey some recent work I have done with Constance van Eeden and others on the use of the weighted likelihood in conjunction with samples from populations different from, but similar to that under study. That resemblence can lead to very effective trade-offs of bias for precision when it derives from structural relations among the various population parameters, for example, when the difference in the population means may be bounded by a fixed constant.


Topo da página