Ciclo de Palestras 2005 – 2º Semestre

Palestras do Departamento de Metodos Estatísticos - Instituto de Matemática - UFRJ

As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

07/12

Neste trabalho, três modelos foram considerados para análise de um conjunto de dados obtido de um ensaio de controle biológico para Diatraea saccharalis, uma praga comum em plantações de cana-de-açúcar. Usando-se o modelo binomial, um ajuste adequado não pôde ser obtido, devido à superdispersão gerada pela variabilidade da média e pelo excesso de zeros. O segundo modelo foi o beta-binomial que leva em consideração a variabilidade da média e o terceiro foi o modelo beta-binomial inflacionado de zeros (ZIBB). Um outro conjunto de dados proveniente de um experimento para o controle de pragas na produção de milhos avaliados ao longo do tempo foi utilizado, sendo a variável resposta o número de lagartas. Neste caso, devido ao excesso de respostas zero, empregou-se o modelo Poisson inflacionado de zeros (ZIP), além do modelo Poisson padrão e devido aos dados serem observados ao longo do tempo incluiu-se o modelo ZIP com efeito aleatório. A estimação dos parâmetros dos modelos foi realizada através da abordagem Bayesiana, usando-se métodos de Monte Carlo com Cadeias de Markov (MCMC) e para a seleção dos modelos usou-se o fator de Bayes. A convergência da cadeia foi diagnosticada através da análise gráfica dos valores gerados e dos diagnósticos apropriados implementados no módulo CODA disponíveis no software R.

A Teoria dos Valores Extremos Multivariados e seus métodos tratam da caracterização, estimação e extrapolação das “caudas conjuntas” da distribuição multidimensional. As abordagens existentes são baseadas em argumentos limites em que todas as váriáveis são extremas. Iremos aplicar a proposta de um modelo multivariado para situações em que pelo menos uma das variáveis é extrema, desenvolvido por Heffernan e Tawn, 2004. O cálculo correto das probabilidades dos eventos extremos ocorrem em diversas aplicações, a aplicação que consideramos aqui é em relação a riscos hidrológicos. Nós examinamos os níveis de três rios provocam inundações em Porto Rico, os rios Fajardo, Canovanas e Espirito Santo, os quais monitoram as situações de enchente nessa região, durante o período de abril de 1967 a setembro de 2002, inclusive.

Neste trabalho, desenvolvemos a priori de Jeffreys para a estimação Bayesiana em modelos espaço de estados. A priori de Jeffreys é obtida a partir da Matriz de Informação esperada de Fisher (MI). Como em geral em modelos espaço de estados MI não possui uma forma analítica fechada a calculamos via filtro de Kalman como proposto em [CAVANAUGH & SHUMWAY, Statistics and Probability Letters 26 (1996) 347-355]. Calcular MI, no entanto, é muito demorado e por isso estudamos também a priori obtida substituindo-se MI pela matriz de informação observada de Fisher. A priori assim obtida pode ser considerada uma aproximação para a priori de Jeffreys. Consideramos vários estimadores Bayesianos, como a moda, a média e a mediana a posteriori, obtidos a partir dessas prioris e também, para efeito de comparação, da priori uniforme. Note que quando a priori uniforme é utilizada, a moda a posteriori coincide com o estimador de máxima verossimilhança. Comparamos para alguns casos particulares de modelos de espaço de estados a performance dos vários estimadores obtidos. Resultados preliminares indicam que o desempenho dos estimadores depende da razão sinal-ruído. Porém, de uma forma geral, o EMV é muito bom para estimar o estado latente no tempo inicial, enquanto que a média a posteriori com priori de Jeffreys é melhor para estimar as variâncias das pertubações.

21/10 Prévias de Mestrado (Excepcionalmente 6ª feira -13h - C116)

Este trabalho tem como objetivo modelar processos (fenômenos) que se caracterizam pela variação no tempo e no espaço e pela presença excessiva de zeros. Utiliza-se uma mistura de distribuições, incluindo massa de probabilidade no ponto 0(zero). Serão abordados modelos para variáveis contínuas (exponencial, gama, log-normal) e discretas (poisson), utilizando processos gaussianos e efeitos autorregressivos condicionais (CAR), no âmbito da dependência espacial. É adotada a abordagem bayesiana, com a utilização de métodos de Monte Carlo via Cadeia de Markov (MCMC). Aplicaremos o(s) modelo(s) a dados de chuva da cidade do Rio de Janeiro, para variáveis contínuas e dados de dengue, também da cidade do Rio de Janeiro, para variáveis discretas. Ao final do estudo é feita a modelagem conjunta de dengue e chuva, examinando o excesso de zeros em ambos os casos.

Embora os modelos lineares generalizados sejam capazes de contornar o problema de não normalidade da variável resposta, ainda assim estes apresentam restrições. Uma delas reside no fato de que, em diversas situações, tem-se variáveis explicativas que não impactam a resposta média de forma linear. Além disso, para algumas variáveis o foco não está na estimativa dos efeitos das mesmas, mas apenas na consideração da possível existência destes efeitos. A classe dos Modelos Aditivos Generalizados proposta por Hastie e Tibshirani (1990) permite que o preditor linear seja substituído por um preditor aditivo, composto pela soma de funções s quaisquer, sendo as funções suaves as mais indicadas. O presente trabalho propõe-se a estudar uma forma de trabalhar com variáveis que são incorporadas de forma não-paramétrica no modelo. A abordagem de estimação utilizada é bayesiana e os modelos são ajustados a um conjunto de dados de mortalidade de São Paulo, com observações feitas no período de 01 de janeiro de 1994 a 31 de dezembro de 1997. Os resultados obtidos são comparados aos mesmos modelos ajustados segundo o enfoque clássico, e uma segunda aplicação é feita utilizando uma série mensal de chuva e vazão observada na bacia do Rio Grande (BA), no período de agosto de 1984 a setembro de 2004.

26/08

We will review, from a historical point of view, the use of Levy processes in ruin theory. We focus on the decomposition for the ruin probability and we argue how its convolution structure is inherited from the Levy family of processes. We will discuss the notion of discounte penalty function in the framework of Levy risk processes. The problem of finding expressions for this function in a risk model driven by a Levy process will be addressed. Examples for which these expressions are available will be discussed. Expressions for the joint density of the process prior and at ruin are presented for a few examples. These include the gamma process and the inverse Gaussian process. Finally, forms of the discounted penalty function in a more general setting will be discussed.

10/08

A palestra apresentará a empresa Bayes Forecast que está iniciando suas operações no Brasil. A Bayes Forecast, é uma empresa de Business Intelligence Quantitativo, especializada no desenvolvimento de sistemas de previsão, atenção e monitoramento da demanda, gestão dos investimentos de publicidade entre outras aplicações. Tratará sobre histórico, sua identidade, o enfoque de comercializar seus serviços, sua filosofia de modelagem aberta e ferramentas open source. Abordaremos algumas das soluções implementadas em seus clientes e também as perspectivas de contratação de profissionais de estatísticas.

23/11

Em grande parte dos modelos estatísticos as quantidades de interesse são os parâmetros de escala e de locação (ou alguma função desses). Neste trabalho nós estudamos modelos de locação e escala na presença de informações conflitantes. Em termos simples, dizemos que duas fontes de informação (por ex. dados e informação a priori) estão em conflito se elas carregam informações muito discrepantes sobre o mesmo parâmetro; em termos probabilísticos isso basicamente significa que as funções (verossimilhanças/densidades) que carregam informações sobre o parâmetro de interesse estão concentradas longe umas das outras. Veja O’Hagan e Forster (2004) para maiores detalhes. Quando esse problema ocorre, se modelarmos tradicionalmente (usando distribuições da familia exponencial), a distribuição a posteriori pode ser fortemente influenciada pela informação conflitante, e potencialmente levar a conclusões erradas. A literatura sobre esse problema tem se concentrado em estabelecer condições nas distribuições do modelo para que a distribuição a posteriori descarte automaticamente a informação que estaria causando o conflito. No entanto, essas condições propostas, além de serem difíceis de aplicar, têm se concentrado basicamente em modelos de locação. Neste trabalho, nós introduzimos a teoria de variação regular no contexto de modelagem robusta bayesiana, o que nos permite uma interpretação muito mais fácil de modelagem usando caudas pesadas. Como consequência, em modelos de locação e escala, nós propomos condições suficientes nas distribuições do modelo que resultam na resolução do conflito rejeitando automaticamente a informação conflitante. Todas as formas de conflitos serão consideradas, isto é conflitos causados tanto pelos dados (outliers) ou pela informação a priori.

26/10 Prévias de Mestrado

A Teoria de Valores Extremos é um ramo da probabilidade que estuda o comportamento estocástico de extremos associados à uma distribuição F. Na prática, F é desconhecida, tornando os cálculos exatos impossíveis. No entanto, sob certas suposições, o comportamento aproximado do máximo, ou mais geralmente, das r maiores estatísticas de ordem, é descrito por uma família de distribuições conhecida. As abordagens existentes em finanças são geralmente baseadas nos máximos e mínimos. Iremos aplicar o modelo para as r-maiores estatísticas de ordem proposto por Smith (1986), para o caso Gumbel, a partir dos desenvolvimentos teóricos de Weissman (1978), e generalizado por Tawn (1988), para avaliar a influência da inclusão das r-maiores estatísticas de ordem no cálculo de medidas de risco. Examinaremos os índices de cinco países que compõem o chamado mercado emergente, Argentina, Brasil, Chile, Índia e Singapura, no período de 31 de dezembro de 1993 a 31 de dezembro de 2005. A análise se divide em duas partes. Primeiro, iremos utilizar estimação por máxima verossimilhança e supor o vetor de parâmetros constante no tempo. Depois, iremos supor ser o vetor de parâmetros uma função suave no tempo, mas não-paramétrica, usando métodos de verossimilhança local como proposto por Heffernan et al (2004).

Atualmente, as doenças do aparelho circulatório são as principais causas de morte no Brasil. Entretanto, tem sido observado um declínio da mortalidade por essas doenças. Nota-se que este declínio acontece de forma diferenciada para cada faixa etária da população, dependendo também do período considerado. A modelagem do declínio destas taxas no Rio de Janeiro, no período de 1980 a 2002, para cada faixa etária, é o objeto deste estudo. As análises se dividem em duas abordagens. A primeira é baseada no conceito do fator de redução de mortalidade, utilizado por Renshaw e Haberman (2003), onde modela-se o número de mortes como um modelo linear generalizado Poisson com sobredispersão. Na segunda abordagem, a força de mortalidade é avaliada utilizando modelos de crescimento exponencial generalizados. Conceitos de modelagem dinâmica bayesiana serão empregados em ambas as abordagens.

Neste seminário discutimos uma nova família paramétrica de modelo de risco não-proporcional dependente do tempo (McKenzie, 1999). O modelo é baseado na generalização da função logística usual e é motivado, em parte, pela necessidade de se considerar o efeito do tempo na modelagem, e, em parte, pela preferência em se considerar uma estrutura paramétrica para a função de risco. Vários procedimentos inferenciais relacionados a esta nova família de modelos são apresentados.

21/09

O Instituto Brasileiro de Geografia e Estatística – IBGE enfrenta constantemente o desafio de produzir estimativas com alto nível de precisão para pequenos domínios ou áreas. Pequenos domínios são aqueles para os quais não se consegue obter estimativas para os parâmetros de interesse, com a precisão adequada, através de procedimentos tradicionais de amostragem. Este trabalho tem por objetivo desenvolver modelos de séries temporais para estimação em pequenos domínios em pesquisas amostrais repetidas. A série utilizada neste trabalho é proveniente da Pesquisa Mensal de Emprego – PME, no período de janeiro de 2000 a fevereiro de 2005. O método foi desenvolvido para fornecer estimativas da taxa de desocupação, por sexo, sob a restrição de que as estimativas obtidas sejam compatíveis com a taxa de desocupação referente ao total da população publicada pelo instituto (benchmarking).