Modelos Dinâmicos Bayesianos para Processos Pontuais Espaço-Temporais por Edna Afonso Reis - Versão HTML

ATENÇÃO: Esta é apenas uma visualização em HTML e alguns elementos como links e números de página podem estar incorretos.
Faça o download do livro em PDF, ePub para obter uma versão completa.

Universidade Federal do Rio de Janeiro

Modelos Dinâmicos Bayesianos para

Processos Pontuais Espac

¸o-Temporais

Edna Afonso Reis

Rio de Janeiro

2008

Modelos Dinâmicos Bayesianos para

Processos Pontuais Espac

¸o-Temporais

Edna Afonso Reis

Tese de Doutorado submetida ao Programa de

Pós-graduaç˜ao em Estat´ıstica do Instituto de

Matemática da Universidade Federal do Rio de

Janeiro como parte dos requisitos necessários para

obtenç˜ao do grau de Doutor em Estat´ıstica.

Orientadores: Dani Gamerman

Marina Silva Paez

Rio de Janeiro

2008

Reis, Edna Afonso

Modelos Dinâmicos Bayesianos para Processos Pontuais Espaço-

Temporais – Rio de Janeiro:UFRJ/IM, 2008.

vi, 142f.: il, color.; 31cm.

Orientadores: Dani Gamerman e Marina Silva Paez

Tese (Doutorado em Estat´ıstica) – UFRJ/IM/Programa de Pós-

graduaç˜ao em Estat´ıstica, 2008.

Referências Bibliográficas: f. 118 – 123.

1. . 2. . 3. . I. Gamerman, Dani e Paez, Marina S. (Orient.). II.

Universidade Federal do Rio de Janeiro, Instituto de Matemática. III.

T´ıtulo.

Modelos Dinâmicos Bayesianos para

Processos Pontuais Espac

¸o-Temporais

Edna Afonso Reis

Tese de Doutorado submetida ao Programa de Pós-graduaç˜ao em Estat´ıstica do

Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte

dos requisitos necessários para obtenç˜ao do grau de Doutor em Estat´ıstica.

Presidente, Prof. Dani Gamerman

IM-UFRJ

Prof. a Marina Silva Paez

Prof. a Alexandra Mello Schmidt

IM-UFRJ

IM-UFRJ

Prof. a Nancy Lopes Garcia

Prof. Jorge Alberto Achcar

IMECC-UNICAMP

ICMC-USP

Rio de Janeiro, 08 de maio de 2008.

Para meu pai,

Dálvio.

( in memoriam)

AGRADECIMENTOS

A autora expressa seus mais sinceros agradecimentos às seguintes pessoas e entidades por sua

valiosa contribuiç˜ao para a realizaç˜ao deste trabalho:

Meus orientadores Dani e Marina, pela dedicaç˜ao e paciência;

Ramiro e Em´ılia, pelo importante apoio na fase final;

Minha m˜ae Oraida, irm˜as Ilka e Tânia, amigas Esther e Romy, pelo carinho;

Eduardo, secretário da PPG-IM, pela sua presteza e eficiência;

Colegas e professores do PPG em Estat´ıstica da UFRJ;

FAPERJ e CAPES, pelo suporte financeiro;

Departamento de Estat´ıstica e Universidade Federal de Minas Gerais, pela licença con-

cedida para realizaç˜ao do curso.

RESUMO

Modelos Dinâmicos Bayesianos para

Processos Pontuais Espac

¸o-Temporais

Edna Afonso Reis

Orientadores: Dani Gamerman

Marina Silva Paez

Resumo da Tese de Doutorado submetida ao Programa de Pós-graduaç˜ao em Es-

tat´ıstica do Instituto de Matemática da Universidade Federal do Rio de Janeiro

como parte dos requisitos necessários para obtenç˜ao do grau de Doutor em Es-

tat´ıstica.

O estudo de processos pontuais observados no espaço e no tempo tem se tornado uma impor-

tante área da Estat´ıstica Espacial. Nesta tese, é proposto um modelo espaço-temporal especi-

ficado por uma seqüência de superf´ıcies de intensidades espaciais ligadas no tempo através de

modelos dinâmicos, resultando nos denominados processos pontuais espaciais dinâmicos. A

inferência para esses processos é feita sob a abordagem bayesiana, com utilizaç˜ao de métodos

MCMC, como o amostrador de Gibbs e o algoritmo de Metropolis-Hastings. Os modelos e

métodos de estimaç˜ao propostos foram intensivamente testados em estudos simulados e apli-

cados em um conjunto de dados experimentais de impulsos elétricos no intestino delgado de

gatos e em um conjunto de dados observacionais dos casos de doenças gastrointestinais no

condado de Hampshire, no Reino Unido.

Palavras-chave: processos pontuais espaço-temporais; modelos dinâmicos; inferência bayesia-

na; MCMC; mapeamento de doenças.

ABSTRACT

Bayesian Dynamic Models for

Space-Time Point Processes

Edna Afonso Reis

Advisors: Dani Gamerman

Marina Silva Paez

Abstract of doctoral thesis submited to the Graduate Program in Statistics of the

Instituto de Matemática da Universidade Federal do Rio de Janeiro, as required

to the Doctor degree in Statistics.

Point processes in time and space has gained an important role in Spatial Statistics. In

this thesis, a spatio-temporal model is proposed by specifying a sequence of spatial intensity

surfaces linked in time through dynamic models. This is denoted by dynamic spatial point

process. A Bayesian inference approach was adopted and MCMC methods as Gibbs sampler

and Metropolis-Hastings algorithm were used. Models and inference methods were intensively

tested through simulated data. These models were applied to an experimental dataset of

spikes in the small intestine of cats and to an observational dataset of cases of gastroenteric

disease in the county of Hampshire, UK.

Key-words: space-time point processes; dynamic models; Bayesian inference; Monte Carlo

Markov chain; disease mapping.

Lista de Figuras

2.1 Os tipos básicos de arranjos pontuais espaciais . . . . . . . . . . . . . . . . . . . 20

2.2 Exemplo de construç˜ao de uma grade regular . . . . . . . . . . . . . . . . . . . 25

2.3 Exemplo de construç˜ao da tesselagem de Voronoi . . . . . . . . . . . . . . . . . 26

3.1 Exemplo 3.1: Mapa dos eventos gerados . . . . . . . . . . . . . . . . . . . . . . 36

3.2 Exemplo 3.1: Resultados de estimaç˜ao dos efeitos espaciais . . . . . . . . . . . . 37

3.3 Exemplo 3.1: Histogramas das amostras a posteriori do coeficiente de regress˜ao e

dos hiperparâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.4 Exemplo 3.2: Mapa dos eventos gerados . . . . . . . . . . . . . . . . . . . . . . 38

3.5 Exemplo 3.2: Resultados de estimaç˜ao dos efeitos espaciais . . . . . . . . . . . . 39

3.6 Exemplo 3.2: Histogramas das amostras a posteriori do coeficiente de regress˜ao e

dos hiperparâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.7 Exemplo 3.3: Especificaç˜oes de prioris para σ 2 e θ. . . . . . . . . . . . . . . . . . 41

3.8 Exemplo 3.3: Histogramas das amostras a posteriori de σ 2 e θ. . . . . . . . . . . 42

3.9 Exemplo 3.4: Mapas dos processos gaussianos e eventos gerados . . . . . . . . . . 43

3.10 Exemplo 3.4: Resultados de estimaç˜ao dos efeitos espaciais . . . . . . . . . . . . 43

5.1 Modelo estacionário: valores gerados das log-intensidades . . . . . . . . . . . . . 71

5.2 Modelo estacionário: eventos gerados . . . . . . . . . . . . . . . . . . . . . . . 71

5.3 Modelo n˜ao-estacionário: valores gerados ds log-intensidades . . . . . . . . . . . . 72

5.4 Modelo n˜ao-estacionário: eventos gerados . . . . . . . . . . . . . . . . . . . . . 72

5.5 Modelo estacionário: histogramas das amostras a posteriori dos hiperparâmetros . . 73

5.6 Modelo estacionário: inferência dos efeitos φ . . . . . . . . . . . . . . . . . . . . 74

ix

5.7 Modelo estacionário: imagens dos valores reais e médias a posteriori das log-intensidades 75

5.8 Modelo n˜ao-estacionário: histogramas das amostras a posteriori dos hiperparâmetros 76

5.9 Modelo n˜ao-estacionário: inferência dos efeitos φ . . . . . . . . . . . . . . . . . 77

5.10 Modelo n˜ao-estacionário: imagens dos valores reais e médias a posteriori das log-

intensidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.11 Modelo com tendência temporal linear: mapas dos efeitos espaciais reais e eventos . 80

5.12 Modelo com tendência temporal linear: resultados de estimaç˜ao dos hiperparâmetros 81

5.13 Modelo com tendência temporal linear: resultados de estimaç˜ao dos efeitos espaciais 82

5.14 Modelo com tendência temporal dinâmica polinomial de primeira ordem: mapas das

somas dos efeitos espaciais e temporais e da localizaç˜ao dos eventos gerados . . . . 84

5.15 Modelo com tendência temporal dinâmica polinomial de primeira ordem: resultados

de estimaç˜ao dos hiperparâmetros . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.16 Modelo com tendência temporal dinâmica polinomial de primeira ordem: resultados

de estimaç˜ao dos efeitos espaciais . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.17 Modelo com tendência temporal dinâmica polinomial de primeira ordem: resultados

de estimaç˜ao dos efeitos temporais

. . . . . . . . . . . . . . . . . . . . . . . . 87

5.18 Modelo com tendência temporal dinâmica polinomial de segunda ordem: mapas das

somas dos efeitos espaciais e temporais e da localizaç˜ao dos eventos gerados . . . . 89

5.19 Modelo com tendência temporal dinâmica polinomial de segunda ordem: resultados

de estimaç˜ao dos hiperparâmetros . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.20 Modelo com tendência temporal dinâmica polinomial de segunda ordem: resultados

de estimaç˜ao dos efeitos espaciais . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.21 Modelo com tendência temporal dinâmica polinomial de segunda ordem: resultados

de estimaç˜ao dos efeitos temporais µ[ t] . . . . . . . . . . . . . . . . . . . . . . 92

5.22 Modelo com tendência temporal dinâmica polinomial de segunda ordem: resultados

de estimaç˜ao dos efeitos temporais β[ t] . . . . . . . . . . . . . . . . . . . . . . . 92

6.1 Mapa do contorno do condado de Hampshire e eventos observados em cada ano . . 94

6.2 Totais de casos mensais nos três anos do estudo . . . . . . . . . . . . . . . . . . 95

6.3 Grade regular com 270 células sobreposta à regi˜ao de estudo . . . . . . . . . . . . 95

6.4 Histogramas das amostra a posteriori dos hiperparâmetros . . . . . . . . . . . . . 97

6.5 Mapas das médias a posteriori dos efeitos espaciais . . . . . . . . . . . . . . . . 98

6.6 Número de impulsos na grade espacial no intestino de um gato, durante 13 ondas

lentas sucessivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6.7 Histogramas das amostras a posteriori dos hiperparâmetros do modelo 1 . . . . . . 105

6.8 Histogramas das amostras a posteriori dos hiperparâmetros do modelo 2 . . . . . . 106

6.9 Histogramas das amostras a posteriori dos hiperparâmetros do modelo 3 . . . . . . 107

6.10 Histogramas das amostras a posteriori dos hiperparâmetros do modelo 3b . . . . . 108

6.11 Histogramas das amostras a posteriori dos hiperparâmetros do modelo 3c . . . . . 109

6.12 Médias a posteriori e intervalos de 90% de credibilidade dos efeitos temporais . . . 110

6.13 Médias a posteriori e intervalos de credibilidade de 90% dos efeitos espaço-temporais 111

6.14 Mapas das médias a posteriori dos efeitos espaço-temporais φ[ i,t] dos modelos 1, 2,

3 e 3c, para t = 1 , ..., 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

6.15 Mapas das médias a posteriori dos efeitos espaço-temporais φ[ i,t] dos modelos 1, 2,

3 e 3c, para t = 8 , ..., 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

6.16 Mapas de variabilidade dos efeitos espaço-temporais φ[ i,t] do modelo 3, para t=1 , ..., 13114

Lista de Tabelas

6.1 Médias a posteriori e Intervalo de Credibilidade de 90% para os hiperparâmetros. . . 104

6.2 Resultados dos critérios de seleç˜ao de modelos. . . . . . . . . . . . . . . . . . . 104

xii

Sumário

Lista de Figuras

ix

Lista de Tabelas

xii

Cap´ıtulo 1:

Introduç˜

ao

1

1.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2 Inferência Bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

1.2.1

O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

1.2.2

Análise da Distribuiç˜ao a Posteriori . . . . . . . . . . . . . . . . . . .

3

1.2.3

Escolha da Distribuiç˜ao a Priori . . . . . . . . . . . . . . . . . . . . .

4

1.3 Métodos MCMC na Inferência Bayesiana . . . . . . . . . . . . . . . . . . . .

5

1.3.1

Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.3.2

Algoritmo de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . .

6

1.3.3

Avaliaç˜ao da Convergência da Cadeia . . . . . . . . . . . . . . . . . .

7

1.4 Modelos Dinâmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.4.1

Modelos Dinâmicos Lineares . . . . . . . . . . . . . . . . . . . . . . .

8

1.4.2

Modelos Dinâmicos Lineares Generalizados . . . . . . . . . . . . . . .

9

1.5 Seleç˜ao de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.5.1

DIC - Deviance Information Criterion . . . . . . . . . . . . . . . . . . 11

1.5.2

EPD - Expected Predictive Deviance . . . . . . . . . . . . . . . . . . 12

1.6 Organizaç˜ao da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

i

Cap´ıtulo 2:

Processos Espaciais

14

2.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Processos Espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3 O Processo Gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.1

Simulaç˜ao de Dados de Processos Gaussianos . . . . . . . . . . . . . . 16

2.3.2

Fam´ılias de Funç˜oes de Correlaç˜ao Espaciais . . . . . . . . . . . . . . 17

2.4 Processos Espaciais Pontuais . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.4.1

Tipos de Arranjos Pontuais . . . . . . . . . . . . . . . . . . . . . . . 19

2.4.2

Alguns Modelos para Processos Espaciais Pontuais . . . . . . . . . . . 20

2.4.3

Simulaç˜ao de Dados de Processos Espaciais Pontuais . . . . . . . . . . 22

2.5 Processos Pontuais Espaço-Temporais . . . . . . . . . . . . . . . . . . . . . . 23

2.6 Inferência via Discretizaç˜ao no Espaço e/ou Tempo . . . . . . . . . . . . . . . 24

Cap´ıtulo 3:

Modelos para Processos Pontuais Espaciais

27

3.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.2 Modelo Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 Aspectos Computacionais da Inferência . . . . . . . . . . . . . . . . . . . . . 29

3.3.1

Amostragem dos Efeitos Espaciais . . . . . . . . . . . . . . . . . . . . 31

3.3.2

Amostragem do Coeficiente de Regress˜ao . . . . . . . . . . . . . . . . 33

3.3.3

Amostragem dos Parâmetros do Processo Espacial . . . . . . . . . . . 34

3.4 Estudos de Simulaç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.5 Prioris de Referência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.6 Efeito da Discretizaç˜ao no Espaço . . . . . . . . . . . . . . . . . . . . . . . . 41

Cap´ıtulo 4:

Modelos para Processos Pontuais Espaço-Temporais

44

4.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.2 Modelos Espaço-Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2.1

Modelos para a Tendência Temporal . . . . . . . . . . . . . . . . . . 47

4.2.2

Modelos para os Efeitos Espaciais . . . . . . . . . . . . . . . . . . . . 48

4.2.3

Modelos para os Efeitos Espaço-Temporais . . . . . . . . . . . . . . . 48

4.3 Aspectos Computacionais da Inferência . . . . . . . . . . . . . . . . . . . . . 49

4.3.1

Modelo de Tendência Constante . . . . . . . . . . . . . . . . . . . . . 50

ii

4.3.2

Modelo de Tendência Determin´ıstica Linear . . . . . . . . . . . . . . . 56

4.3.3

Modelo de Tendência Dinâmica Polinomial de Primeira Ordem . . . . . 59

4.3.4

Modelo de Tendência Dinâmica Polinomial de Segunda Ordem . . . . . 62

4.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

Cap´ıtulo 5:

Estudos de Simulaç˜

ao

68

5.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.2 Tendência Temporal Constante . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.3 Tendência Temporal Determin´ıstica Linear . . . . . . . . . . . . . . . . . . . 79

5.4 Tendência Temporal Dinâmica Polinomial de Primeira Ordem . . . . . . . . . 83

5.5 Tendência Temporal Dinâmica Polinomial de Segunda Ordem . . . . . . . . . 87

5.6 Conclus˜oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Cap´ıtulo 6:

Aplicaç˜

oes

93

6.1 Introduç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.2 Análise Espaço-Temporal dos Casos de Doença Gastrointestinal em Hampshire

93

6.3 Evoluç˜ao Espaço-Temporal de Impulsos Elétricos no Intestino Delgado . . . . . 99

Cap´ıtulo 7:

Consideraç˜

oes Finais e Trabalhos Futuros

115

7.1 Consideraç˜oes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

7.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

7.2.1

Eficiência Computacional do Processo de Inferência . . . . . . . . . . 116

7.2.2

Análise de Res´ıduos . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

Referências

117

Apêndice A:

124

A.1 O Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

A.2 O Algoritmo FFBS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

A.3 Algoritmo de Gamerman (1997) . . . . . . . . . . . . . . . . . . . . . . . . . 126

iii

1

1

Cap´ıtulo

Introduç˜ao

1.1

Introduç˜

ao

Uma importante área da Estat´ıstica, conhecida como processos pontuais espaciais, é o

estudo de processos de observaç˜ao de eventos em uma dada regi˜ao geográfica. Esta área

tem sido estudada tanto do ponto de vista teórico, onde as propriedades probabil´ısticas desses

processos s˜ao analisadas (Cox e Isham, 1980), quanto pelo estudo de propriedades estat´ısticas,

onde a ênfase se dá no processo de estimaç˜ao da taxa de intensidade dos eventos na regi˜ao

(Diggle, 2003).

Um exemplo de observaç˜ao nessa área é o estudo dos locais de moradia de pessoas acometi-

das de uma particular doença contagiosa. Esse estudo serve para determinar poss´ıveis padr˜oes

de distribuiç˜ao geográfica do risco de contaminaç˜ao. Existem vários estudos já realizados

nessa área, tanto sob o ponto de vista bayesiano quanto sob o ponto de vista freqüentista, em

diversos campos de aplicaç˜ao, como epidemiologia (Diggle, 2000), criminologia (Liu e Brown,

2003), geologia (Ogata, 1998), dentre outros.

Uma extens˜ao relevante do problema consiste em considerar também a dimens˜ao temporal.

Nesse caso, n˜ao só o local de ocorrência é registrado, mas também o momento. Para o exemplo

de mapeamento de doenças descrito acima, esses processos têm a grande utilidade de permitir

a caracterizaç˜ao do processo de espalhamento do risco de contaminaç˜ao. Com isso, é poss´ıvel

estabelecer uma estratégia de controle da dispers˜ao da doença na regi˜ao, bem como implantar

um sistema de alarme para detecç˜ao de novos focos ou de previs˜ao do padr˜ao espacial da

doença em tempos futuros.

2

Dentro desse enfoque, uma poss´ıvel estratégia é a de especificar uma seqüência de taxas

de intensidades do processo no espaço ligadas através do tempo. A proposta desta tese é

caracterizar de forma n˜ao-paramétrica a seqüência de taxas de intensidade do processo com

vistas à definiç˜ao de formas apropriadas de estimaç˜ao e previs˜ao do processo. O objetivo

é a formulaç˜ao de modelos levando em consideraç˜ao esses aspectos e propondo formas de

inferência para eles. Para isso, será tomada como ponto de partida a modelagem através

de processos gaussianos usada em Gelfand et al. (2005) no contexto de processos espaciais

cont´ınuos, acoplada à evoluç˜ao dinâmica das taxas de intensidades proposta em Paez (2004) no

contexto de processos pontuais. Os modelos resultantes s˜ao chamados de processos pontuais

espaciais dinâmicos, por terem essa estrutura de evoluç˜ao das taxas de intensidade ao longo

do tempo.

A inferência para esses processos é feita sob o ponto de vista bayesiano, com utilizaç˜ao

de métodos de amostragem Monte Carlo via Cadeias de Markov ( MCMC, na abreviaç˜ao em

inglês). Com isso, será poss´ıvel obter estimativas para a seqüência de taxas de intensidade

e de parâmetros que estejam presentes na sua especificaç˜ao como, por exemplo, médias e

variâncias de evoluç˜ao temporal e medidas de correlaç˜ao da dispers˜ao espacial. Além disso,

será poss´ıvel especificar as distribuiç˜oes preditivas para as taxas de intensidade de tempos

futuros, possibilitando a previs˜ao de futuras ocorrências de eventos do fenômeno de interesse.

Este cap´ıtulo faz uma breve revis˜ao dos conceitos e métodos estat´ısticos utilizados no

desenvolvimento da tese, e está organizado do seguinte modo: na próxima seç˜ao é feita uma

revis˜ao do procedimento bayesiano de inferência e na seç˜ao seguinte s˜ao descritos alguns

métodos computacionais aplicados à inferência bayesiana; na Seç˜ao 1.4 é feita uma ilustraç˜ao

destes métodos computacionais no contexto de uma breve revis˜ao de modelos dinâmicos;

alguns critérios de seleç˜ao de modelos s˜ao apresentados na Seç˜ao 1.5; finalmente, a Seç˜ao 1.6

descreve a organizaç˜ao dos cap´ıtulos da tese.

1.2

Inferência Bayesiana

Nesta seç˜ao, s˜ao apresentados os conceitos básicos da inferência bayesiana necessários ao

entendimento da tese. Para uma discuss˜ao ampla e detalhada sobre o tema, s˜ao recomendados

os livros de Berger (1985), Bernardo e Smith (1994) e Migon e Gamerman (1999).

3

1.2.1

O Teorema de Bayes

No procedimento bayesiano de inferência, a informaç˜ao prévia sobre o vetor de parâmetros

θ, contida na distribuiç˜ao a priori π( θ), é combinada com a informaç˜ao dos dados y, contida na funç˜ao de verossimilhança f ( y | θ), resultando na distribuiç˜ao a posteriori π( θ | y). O

teorema de Bayes é a regra desta atualizaç˜ao da informaç˜ao sobre os parâmetros:

f ( y | θ) π( θ)

π( θ | y) =

,

p( y)

onde

p( y) =

f ( y | θ) π( θ) dθ.

A influência relativa de cada um destes componentes, priori e verossimilhança, na in-

formaç˜ao a posteriori depende de quanto peso é dado à distribuiç˜ao a priori (o qu˜ao ”infor-

mativa”ela é) e do tamanho da amostra.

1.2.2

Análise da Distribuiç˜

ao a Posteriori

A inferência sobre os parâmetros θ é baseada nas informaç˜oes contidas na distribuiç˜ao a

posteriori, seja através de medidas resumo como média, variância ou percentis, ou de interva-

los de probabilidade:

Definiç˜ao (Intervalo de Credibilidade): C é um intervalo de credibilidade 100(1 −α)% para

um escalar θ se

π( θ | y) = 1 −α, com 0 < α < 1.

C

Esta definiç˜ao é facilmente estendida para a situaç˜ao onde θ é um vetor e C é uma regi˜ao.

Para um α fixo, o intervalo C de menor amplitude é aquele que inclui os pontos de mais alta

densidade a posteriori; s˜ao os chamados intervalos MDP - máxima densidade a posteriori.

A prediç˜ao de uma observaç˜ao futura z, após a observaç˜ao dos dados y, é baseada na

distribuiç˜ao de z| y, chamada de distribuiç˜ao preditiva, dada pela express˜ao

f ( z| y) =

f ( z,θ| y) =

f ( z| θ,y) π( θ| y) =

f ( z| θ) π( θ| y) dθ,

na qual a última passagem ocorre se z e y s˜ao condicionalmente independentes dado θ.

4

A densidade a posteriori π( θ| y) e a distribuiç˜ao preditiva f ( z| y) podem ser t˜ao complexas a ponto de n˜ao permitirem a extraç˜ao anal´ıtica de informaç˜oes descritivas que exijam inte-graç˜ao. Uma maneira de contornar este problema é conduzir a inferência baseada na análise de

uma amostra simulada da distribuiç˜ao a posteriori. Na próxima seç˜ao, s˜ao apresentados alguns

métodos bastante utilizados de obtenç˜ao de amostras da posteriori utilizando-se métodos de

simulaç˜ao estocástica através de cadeias de Markov.

1.2.3

Escolha da Distribuiç˜

ao a Priori

Migon e Gamerman (1999) apresentam diferentes formas de especificaç˜ao da distribuiç˜ao

a priori dos parâmetros. A distribuiç˜ao a priori pode ser determinada a partir de conhecimen-

tos subjetivos ou através do uso de informaç˜oes sobre o parâmetro obtidas de experimentos

passados.

Um procedimento indireto é a especificaç˜ao através de formas funcionais de densidades

paramétricas. Os parâmetros destas formas funcionais da distribuiç˜ao a priori, chamados hiper-

parâmetros, s˜ao escolhidos de modo subjetivo de acordo com informaç˜oes dispon´ıveis. Um

procedimento sistemático é escolher a forma funcional da distribuiç˜ao a priori de modo que as

distribuiç˜oes a priori e a posteriori pertençam à mesma a fam´ılia de distribuiç˜oes, as chamadas

fam´ılias de distribuiç˜oes conjugadas:

Definiç˜ao (Fam´ılia de Distribuiç˜oes Conjugadas): Seja F = {f ( y | θ) , θ ∈ Θ } uma fam´ılia de distribuiç˜oes amostrais (observacionais). Uma classe P de distribuiç˜oes é dita ser uma fam´ılia

conjugada com respeito a F se, para todo f ∈ F e p( θ) ∈ P, tem-se que π( θ | y) ∈ P.

As vantagens da conjugaç˜ao s˜ao especialmente a facilidade da análise e a possibilidade de

explorar o aspecto seqüencial do paradigma bayesiano.

Alguns analistas preferem que a influência da informaç˜ao a priori na inferência seja reduzida

ao m´ınimo, ou seja, permitem que os dados determinem a regi˜ao com maior massa de proba-

bilidade a posteriori. Este é o conceito das prioris n˜ao-informativas ou de referência, também

chamadas de vagas ou planas ( flat). Uma priori n˜ao-informativa pode ser obtida a partir de

uma priori conjugada definindo-se o hiperparâmetro de escala tendendo a zero e mantendo os

outros constantes. Por exemplo, uma priori Normal com média zero e variância muito alta é

relativamente plana. Um parâmetro de variância pode ter distribuiç˜ao a priori Gama inver-

tida pouco informativa se seus hiperparâmetros forem escolhidos com valores suficientemente

5

baixos.

1.3

Métodos MCMC na Inferência Bayesiana

A densidade a posteriori π pode ser muito complexa e imposs´ıvel de ser amostrada direta-

mente. Com o uso de um método Monte Carlo via cadeias de Markov (MCMC, na abreviaç˜ao

em inglês) é poss´ıvel gerar uma cadeia de Markov ergódica que tenha π como distribuiç˜ao

de equil´ıbrio. Assim, após a convergência da cadeia para π, os valores gerados formam uma

amostra desta distribuiç˜ao, que pode ser usada para cálculos de Monte Carlo.

Nesta seç˜ao ser˜ao apresentados o amostrador de Gibbs e o algoritmo de Metropolis-

Hastings, utilizados na inferência bayesiana dos modelos propostos nesta tese. Uma ampla

discuss˜ao destes e de outros métodos, com sua aplicaç˜ao em diversos modelos, é encontrada

em Gamerman e Lopes (2006).

1.3.1

Amostrador de Gibbs

Com o objetivo de obter uma amostra da distribuiç˜ao à posteriori π( θ 1 , ..., θd |y), o

amostrador de Gibbs (Gelfand e Smith, 1990) simula sucessivamente e repetidamente das

distribuiç˜oes condicionais completas de cada componente dados os demais componentes, ou

seja, gera valores de θi de π( θi | θ−i, y) , i = 1 , ..., d, onde θ−i = ( θ 1 , ..., θi− 1 , θi+1 , ..., θd) .

Assume-se que estas distribuiç˜oes s˜ao de fácil amostragem direta.

Os passos deste esquema de amostragem s˜ao:

1. Inicialize o contador de iteraç˜oes da cadeia em j = 1 e atribua valores iniciais

θ(0) = ( θ(0) , ..., θ(0)) ;

1

d

2. Obtenha um novo valor θ( j) = ( θ( j) , ..., θ( j)) através da geraç˜ao sucessiva de valores 1

d

θ( j) ∼ π( θ

, ..., θ( j− 1) , y) ,

1

1 | θ( j− 1)

2

d

θ( j) ∼ π( θ

, θ( j− 1) , ..., θ( j− 1) , y) ,

2

2 | θ( j)

1

3

d

...

θ( j) ∼ π( θ

, ..., θ( j) , y);

d

d | θ( j)

1

d− 1

6

3. Mude o contador de j para j+1 e retorne ao passo 2 até que a convergência da cadeia

seja atingida.

À medida que o número de iteraç˜oes cresce, a cadeia aproxima-se da sua condiç˜ao de

equil´ıbrio. Quando a convergência é atingida, o valor resultante θ( j) é uma observaç˜ao de π.

Assim, na prática, a cadeia é iterada um número suficientemente grande de iteraç˜oes

(digamos, J) tal que se possa assmuir que a convergência foi atingida. Este é o chamado

per´ıodo de burn in. Os valores θ( J) , ..., θ( M) s˜ao tomados como uma amostra da distribuiç˜ao a posteriori de θ. Como os valores seqüenciais nesta amostra s˜ao autocorrelacionados, é usual

tomar uma sub-amostra sistemática dos valores, por exemplo, a cada k > 1 iteraç˜oes, para

reduzir este efeito.

A convergência pode ser muito lenta devido à alta correlaç˜ao entre os elementos de θ.

Uma soluç˜ao para este problema é definir subconjuntos (chamados blocos) dos elementos de

θ que s˜ao amostrados conjuntamente.

1.3.2

Algoritmo de Metropolis-Hastings

Novamente, o objetivo é gerar um valor de θ de uma distribuiç˜ao π( θ). No procedi-

mento de inferência bayesiana, esta distribuiç˜ao pode ser a posteriori de θ ou algumas das

distribuiç˜oes condicionais completas de θi no amostrador de Gibbs, quando estas n˜ao s˜ao de

fácil amostragem direta. A idéia do algoritmo de Metropolis-Hastings (Metropolis et al. , 1953;

Hastings, 1970) é amostrar um valor de θ da densidade q( x | y) (chamada de densidade da

proposta) da qual a geraç˜ao de valores é poss´ıvel ou mais fácil.

Os passos deste esquema de amostragem s˜ao:

1. Inicialize o contador de iteraç˜oes da cadeia em j = 1 e atribua um valor inicial θ(0);

2. Obtenha um novo valor φ para θ gerado da distribuiç˜ao q( φ | θ( j− 1));

3. Avalie a probabilidade de aceitaç˜ao do novo valor, dada por

π( φ)

q( θ( j− 1) | φ)

α( θ( j− 1) , φ) = min

1 ,

.

π( θ( j− 1)) q( φ | θ( j− 1))

Se o novo valor é aceito, θ( j) = φ; caso contrário, θ( j) = θ( j− 1); 7

4. Mude o contador de j para j+1 e retorne ao passo 2 até que a convergência da cadeia

seja atingida.

Após a convergência da cadeia para sua condiç˜ao de equil´ıbrio, digamos, na iteraç˜ao J,

os valores θ( J) , ..., θ( M) constituem-se em uma amostra (correlacionada) da distribuiç˜ao a posteriori de θ.

Em geral, a taxa de aceitaç˜ao dos valores novos é ajustada para cerca de 50% através

da definiç˜ao de uma constante sintonizadora da probabilidade de aceitaç˜ao do valor proposto,

geralmente associada à variância da densidade da proposta q.

Assim como no amostrador de Gibbs, a amostragem dos parâmetros θ também pode ser

feita em blocos de seus elementos.

1.3.3

Avaliaç˜

ao da Convergência da Cadeia

A teoria de MCMC nos garante que a cadeia de Markov irá eventualmente produzir uma

amostra da distribuiç˜ao alvo se a cadeia é rodada por um tempo suficientemente longo. A

quest˜ao de dif´ıcil resposta é saber qu˜ao longo é suficiente para garantir a convergência.

Existem métodos formais de verificaç˜ao da convergência das cadeias, como o procedimento

de Geweke (1992) e a estat´ıstica de Gelman e Rubin (1992), modificada por Brooks e Gelman

(1998). Entretanto, nenhum destes métodos é conclusivo, fornecendo apenas ind´ıcios de

convergência.

Um modo informal simples de verificaç˜ao da convergência é a análise das séries temporais

de várias estat´ısticas derivadas da cadeia de Markov, como somas, médias ou ´ındices úteis

na descriç˜ao dos dados. Considera-se que a cadeia aparentemente convergiu quando a série

temporal destas estat´ısticas estabiliza-se.

Do mesmo modo, pode-se analisar a trajetória de pelo menos duas cadeias independentes

(definidas por diferentes valores iniciais) dos próprios parâmetros e verificar se todas convergem

para o mesmo ponto de estabilidade.

1.4

Modelos Dinâmicos

Modelos dinâmicos s˜ao uma ampla classe de modelos de regress˜ao e de séries temporais nos

quais os parâmetros mudam com a passagem do tempo. Eles incluem como caso particular

8

os modelos estáticos, nos quais esta mudança temporal n˜ao existe.

Nesta seç˜ao ser˜ao apresentados os modelos dinâmicos e seus procedimentos de inferência

utilizados na tese. Detalhes da modelagem, aplicaç˜oes e extensa discuss˜ao do assunto podem

ser encontrados no livro de West e Harrison (1997) e no recente artigo de Migon et al. (2005).

1.4.1

Modelos Dinâmicos Lineares

Os modelos dinâmicos lineares consistem em uma equaç˜ao de regress˜ao relacionando os

parâmetros às observaç˜oes e uma equaç˜ao relacionando entre si os sucessivos parâmetros da

regress˜ao:

Equaç˜ao das observaç˜oes:

yt = F θ

t

t

+ t,

t ∼ N [0; Vt];

Equaç˜ao do sistema:

θt = Gtθt− 1 + ωt,

ωt ∼ N[0; Wt] ,

onde {yt} é uma seqüência de observaç˜oes no tempo, condicionalmente independentes dados

Vt e o vetor de parâmetros de estado θt, Ft é um vetor de variáveis explicativas e Gt é uma matriz que descreve a evoluç˜ao dos parâmetros de estado. O modelo é completado com a

especificaç˜ao de uma priori normal para θ 1.

A seguir s˜ao apresentados dois exemplos dos chamados modelos de tendência.

Exemplo 1.1: O mais simples dos modelos dinâmicos é o chamado modelo polinomial de

primeira ordem, no qual o n´ıvel da série temporal permanece localmente estável, mas varia a

longos intervalos de tempo. Este modelo é descrito por:

yt = µt

+ t,

t ∼ N [0; Vt];