Ciclo de Palestras 2018 – 1° Semestre

Palestras do Departamento de Metodos Estatísticos - Instituto de Matemática - UFRJ

1º semestre de 2018
As palestras ocorrerem no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos de algumas exceções devidamente indicadas.

Lista Completa (palestras previstas para datas futuras podem sofrer alterações):
04/07

A leishmaniose visceral é uma doença infecciosa negligenciada transmitida por insetos de grande relevância no cenário epidemiológico brasileiro e mundial. A doença vem passando por um paulatino processo de urbanização e disseminação geográfica e seu controle representa um desafio para pesquisadores e gestores de saúde. Nessa apresentação discorre-se sobre a situação epidemiológica da doença no país, as bases teórico-conceituais para avaliação de intervenções para o controle da leishmaniose visceral, algumas aplicações de modelos matemáticos para avaliação de estratégias de controle e iniciativas para identificação de áreas de mais alto risco de transmissão.

20/06 (excepcionalmente na UFF às 14hs)

Adsorção cooperativa de gases por estruturas porosas, que permite absorção e remoção mais eficiente do que a adsorção usual não cooperativa (do tipo Langmuir), normalmente é resultado de uma transição de fase da estrutura. Mostramos como a cooperatividade numa classe de estruturas organo-metálicas na ausência de uma transição de fase. Nosso estudo é baseado em um modelo mecânico-estatístico de polimerização de equilíbrio em uma dimensão, cuja solução pode ser obtida por meio de uma matriz de transferência. Os parâmetros desse modelo são determinados por cálculos de DFT. Os resultados levam a uma compreensão da origem microscópica de características da adsorção cooperativa, incluindo a posição, inclinação e altura do degrau na isoterma, indicando como otimizar armazenamento e separação de gases nessas estruturas. (artigo em https://arxiv.org/pdf/1712.05061.pdf).

Tipicamente, o conhecimento da geologia de um meio poroso é muito menos detalhado do que o necessário para predizer deterministicamente as propriedades do escoamento, o que leva à necessidade de se fazer uma caracterização estatística das propriedades dos solos e rochas, dando um caráter estocástico ao problema. Como consequência, modelos realistas que descrevem escoamentos multifásicos em formações heterogêneas devem incorporar esta noção de incerteza. Com o intuito de aumentar a acurácia das previsões de tais modelos, técnicas de inferência Bayesiana e, por exemplo, Métodos de Monte Carlo via cadeias de Markov (MCMC) podem ser utilizados para incorporar dados de campo, dinamicamente, nas simulações.

13/06

O consumo de energia elétrica do setor industrial tem sido amplamente investigado ao longo dos últimos anos, devido a sua importância econômica, social e ambiental. Mais especificamente, o consumo de eletricidade dos subsetores da indústria brasileira exerce grande importância para o sistema energético brasileiro. Neste contexto, as projeções de longo prazo do seu consumo de energia elétrica para um país ou uma região são informações de grande relevância na tomada de decisão de órgãos e entidades que atuam no setor energético. Assim, propomos uma estrutura de modelagem utilizando a abordagem bottom-up para lidar com essas questões e avaliar a trajetória do consumo anual de eletricidade de longo prazo de um setor da indústria brasileira, considerando os cenários de eficiência energética. É importante enfatizar que o Brasil é um país em desenvolvimento, e construir uma abordagem bottom-up foi um desafio, principalmente devido ao fato que esta abordagem é intensiva em dados.

06/06

We address the question of statistical model selection for a class of stochastic models of biological neural nets. Models in this class are systems of interacting chains with memory of variable length. Each chain describes the activity of a single neuron, indicating whether it spikes or not at a given time. The spiking probability of a given neuron depends on the time evolution of its presynaptic neurons since its last spike time. When a neuron spikes, its potential is reset to a resting level and postsynaptic current pulses are generated, modifying the membrane potential of all its postsynaptic neurons. The relationship between a neuron and its pre- and postsynaptic neurons defines an oriented graph, the interaction graph of the model. The goal of this paper is to estimate this graph based on the observation of the spike activity of a finite set of neurons over a finite time. We provide explicit exponential upper bounds for the probabilities of under- and overestimating the interaction graph restricted to the observed set and obtain the strong consistency of the estimator. Our result does not require stationarity nor uniqueness of the invariant measure of the process. This is a joint work with A.Duarte, A. Galves and E. Löcherbach.

23/05 (excepcionalmente na C116 às 14hs)

Vivemos numa era em que a disponibilidade e acessibilidade a dados não tem precedentes. Apesar disso, lacunas substanciais persistem. Além disso, nem todos os dados disponíveis têm a qualidade necessária para seu uso seguro em muitas aplicações. Metodologia estatística fornece a orientação essencial necessária para obter dados atuais, relevantes, precisos e custo-efetivos. Ela também guia a arte e a ciência de extração de conhecimento dos dados para apoiar a tomada de decisões com base em evidências. Vou rever as principais maneiras em que os métodos estatísticos são usados para obter, combinar, processar, analisar e disseminar dados no campo das estatísticas públicas e oficiais. Vou também discutir como os métodos estatísticos são usados para medir qualidade e para alcançar níveis especificados de precisão ao estimar quantidades de interesse.

I review recent work focussing on whether thermodynamics can be extended to nonequilibrium steady states (NESS). The possibility of defining temperature $T$ and chemical potential $mu$ for systems in NESS is analyzed using simple, far-from-equilibrium lattice models with stochastic dynamics. For spatially uniform NESS, coexistence with a reservoir yields consistent definitions of $T$ and $mu$ for a particular choice of the rates used in exchanges between systems. Remarkably, the associated entropy function is not the Shannon entropy of the stationary probability distribution on
configuration space. Consistent definitions of intensive parameters are not possible for nonuniform NESS. Investigation of simple far-from-equilibrium systems exhibiting phase separation leads to the conclusion that phase coexistence is not well defined in this context.

16/05

As estatísticas oficiais são indispensáveis para uma sociedade democrática. Os Institutos Nacionais de Estatística e agências produtoras de estatísticas públicas enfrentam o desafio de produzir estatísticas relevantes e com rapidez, num ambiente de crescente restrição orçamentária e na era da sociedade da informação. A pressão para reduzir os tamanhos de amostra de suas pesquisas, e o ônus dos entrevistados, tornam necessário o desenvolvimento de métodos que utilizem uma combinação de fontes de dados.

Os procedimentos de estimação em pequenas áreas abrangem vários métodos estatísticos desenvolvidos para obter estimativas para áreas geográficas ou domínios de estudo nos quais os tamanhos de amostra são demasiado pequenos para fornecer estimativas diretas confiáveis. Os métodos tem como base modelos de regressão que relacionam as estimativas amostrais com variáveis auxiliares disponíveis para os domínios.

O seminário tem como foco a apresentação de métodos estatísticos de estimação em pequenas áreas e de sua aplicação em trabalhos realizados com dados provenientes de pesquisas amostrais brasileiras.

02/05

Structural identity is a concept of symmetry in which network nodes are identified according to the network structure and their relationship to other nodes. Structural identity has been studied in theory and practice over the past decades, but only recently has it been addressed with representational learning techniques.

This talk presents struc2vec, a novel and flexible framework for learning latent representations for the structural identity of nodes. struc2vec uses a hierarchy to measure node similarity at different scales, and constructs a multilayer graph to encode structural similarities and generate context for nodes. Numerical experiments indicate that in comparison to state-of-the art techniques, struc2vec exhibits superior performance in learning representations that reflect structural identity, overcoming limitations of prior approaches. As a consequence, struc2vec improves performance on classification tasks that depend more on structural identity, as illustrated by the airport network.

Last, to provide context for struc2vec, we also briefly present node2vec, a state-of-the-art technique for learning node representations, but one not targeted at structural identity.

11/04 (excepcionalmente na C116)
04/04

No estudo das infecções sexualmente transmissíveis (ISTs) existem subpopulações que desempenham papel chave no controle ou agravo de uma epidemia. Essas subpopulações geralmente pertececem a populações de difícil acesso tais como usuários de drogas, profissionais do sexo, homens que fazem sexo com outros homens (HSH), etc. Nessa apresentação serão apresentados dois métodos para extrair informação desses grupos. O primeiro método é usado para estimar o tamanho dessas subpopulações, chamado de NSUM (Network scale-up method) que é baseado em informações da rede de contatos de cada participantes selecionado a partir representativa da população geral. O segundo método recruta participantes nessas subpopulações, é um procedimento amostragem não probabilistico baseado em redes chamado RDS (Respondent-driven sampling). Serão apresentadas nessa palestra algumas dificuldades metodológicas sob o ponto de vista estatístico, e alguns resultados parciais de projetos com populações de difícil acesso realizados no Brasil.

21/03 (excepcionalmente as 14:30hs)

In this talk we will have a look at classical actuarial work from a lattice theoretical perspective. Usually, (credit) ratings are totally ordered. In order to compare different ratings from different rating entities, we first develop a generalized directed metric to measure how progressive or conservative these totally ordered ratings are. We then propose an algorithmic solution for rating targets which are still totally ordered but different in size.

Reaching beyond totally ordered sets as rating targets, we eventually characterize suitable rating targets which are only partially ordered. The huge class of lattices which allow for a (finite) Jordan-Dedekind chain condition together with a supermodular rank function will work very well as generalized rating targets. In particular, distributive and modular lattices of finite length have modular rank functions and provide an extended framework for rating targets.

Choosing the number of components in mixture models remains a central but elusive challenge. Traditional model selection criteria can be either overly liberal or conservative when enforcing parsimony. They may also result in poorly separated components of limited practical use. Non-local priors (NLPs) are a family of distributions that encourage parsimony by enforcing a separation between the models under consideration. We formalize NLPs in the context of mixtures and show how they lead to well-separated components that have non-negligible weight, hence interpretable as distinct subpopulations. We derive tractable expressions and suggest default prior settings aimed at detecting multi-modal densities. We also give a theoretical characterization of the sparsity induced by NLPs and propose easily implementable algorithms to obtain the integrated likelihood and parameter estimates. Although the framework is generic we fully develop the multivariate Normal mixture case based on a novel family of exchangeable moment priors. Our results show a serious lack of sensitivity of the Bayesian information criterion (BIC) and insufficient parsimony of the AIC and local prior counterparts to our formulation.

14/03 (excepcionalmente na C116)

We propose a formal specification for sum-zero constrained intrinsic conditional autoregressive (ICAR) models. Our specification first projects a vector of proper conditional autoregressive spatial random effects onto a subspace where the projected vector is constrained to sum to zero, and after that takes the limit when the proper conditional autoregressive model approaches the ICAR model. As a result, we show that the sum-zero constrained ICAR model has a singular Gaussian distribution with zero mean vector and a unique covariance matrix. Previously, sum-zero constraints have typically been imposed on the vector of spatial random effects in ICAR models within a Markov chain Monte Carlo (MCMC) algorithm in what is known as centering-on-the-fly. This mathematically informal way to impose the sum-zero constraint obscures the actual joint density of the spatial random effects. By contrast, the present work elucidates a unique distribution for ICAR random effects. Further, we show that this distribution is the limiting distribution of the one-at-a-time Gibbs sampler for Besag’s intrinsic CAR model with centering on the fly. The explicit expressions for the resulting unique covariance matrix and density function are useful for the development of Bayesian methodology in spatial statistics which will be useful to practitioners. We illustrate the practical relevance of our results by using Bayesian model selection to jointly assess both spatial dependence and fixed effects.