Equações estruturais aplicadas a modelos causais de câncer de pulmão por Valéria Troncoso Baltar - Versão HTML

ATENÇÃO: Esta é apenas uma visualização em HTML e alguns elementos como links e números de página podem estar incorretos.
Faça o download do livro em PDF, ePub, Kindle para obter uma versão completa.

Universidade de São Paulo

Faculdade de Saúde Pública

Equações estruturais aplicadas a modelos causais de

câncer de pulmão

Valéria Troncoso Baltar

Tese apresentada ao Programa de Pós-

Graduação em Saúde Pública para

obtenção de título de Doutor em Saúde

Pública

Área de concentração: Epidemiologia

Orientador: Prof. Dr. Júlio César

Rodrigues Pereira

São Paulo

2011

Equações estruturais aplicadas a modelos causais de

câncer de pulmão

Valéria Troncoso Baltar

Tese apresentada ao Programa de Pós-

Graduação em Saúde Pública da

Faculdade de Saúde Pública da

Universidade de São Paulo para

obtenção de título de Doutor em Saúde

Pública

Área de concentração: Epidemiologia

Orientador: Prof. Dr. Júlio César

Rodrigues Pereira

São Paulo

2011

É expressamente proibida a comercialização deste documento, tanto na

sua forma impressa como eletrônica. Sua reprodução total ou parcial é

permitida exclusivamente para fins acadêmicos e científicos, desde que

na reprodução figure a identificação do autor, título, instituição e ano da

tese.

Para meus pais, Eugenia e Paulo.

AGRADECIMENTOS

Em primeiro lugar, gostaria de agradecer aos professores Júlio Pereira e Paolo Vineis

pela orientação. Ao Júlio, orientador e amigo de uma vida (meu chefinho) que

participou em todas as decisões profissionais que eu tomei desde que nos

conhecemos. Ao Paolo, pela orientação e apoio nesse ano de aprendizado na Imperial

College. Agradeço ainda aos professores Dirce Marchioni, Lúcia Barroso, Gizelton

Alencar e Sergio Koifman, pelas críticas e sugestões na pré-banca, que ajudaram a

melhorar este trabalho.

Também não posso deixar de registrar meus agradecimentos a Annelie e a Cristina

pela ajuda na revisão da versão final.

Ao pessoal do LEE, em especial, à Helen, ao Valdir e à Robertinha pela amizade de

sempre. Às minhas amigas, Rejane e Cris, sempre me incentivando.

Ao pessoal da salinha: Clóvis, Angelinha, Dani, Rossana, Mônica, Raquel e Tati,

pelo companheirismo; e em especial à Bruna, pelo apoio integral na reta final. Ao

pessoal das secretarias, principalmente à Angela, à Renilda e ao Fernando.

Aos amigos da Imperial College, especialmente à Wei, Rosa, Rui, Aneire, Doris,

Anne-Claire, Shu-Chun e Karin, pela amizade e pelas discussões que enriqueceram

este trabalho.

Aos meus amigos que compreenderam minhas ausências e me incentivaram nos

momentos mais difíceis. A todos os amigos de Londres, que também foram

importantes pra conclusão desta tese. A todos que, direta ou indiretamente,

colaboraram nesses 4 anos de doutorado.

À toda minha família, em especial aos meus pais que me deram total apoio,

financeiro e moral, quando decidi me dedicar exclusivamente ao doutorado. Aos

meus irmãos, Carol e Paulão, pela cumplicidade de sempre. Às minhas primas-irmãs,

Mari e Liginha, sempre atenciosas e me dando muito carinho. Gostaria de lembrar a

querida tia Bel, com saudades, pelas longas conversas que me ajudaram a decidir o

que fazer da minha vida profissional. À toda minha família, do Recife e do Chile.

Por fim, agradeço ao CNPq e à CAPES pelo auxílio financeiro

RESUMO

Baltar VT. Equações estruturais aplicadas a modelos causais de câncer de

pulmão. São Paulo; 2011. [Tese de doutorado – Faculdade de Saúde Pública da

USP]

Introdução: O câncer de pulmão (CP) é o tipo de câncer que mais mata no mundo e

o cigarro ainda é sua causa mais importante. Além disso, a alimentação tem sido

associada ao CP, por ser fonte de vitaminas e aminoácidos que fazem parte do

metabolismo do carbono (MC). O MC é considerado mecanismo chave na

manutenção da integridade do DNA e na regulação da expressão gênica, que, dessa

forma, deve estar relacionado à carcinogênese. A ativação da imunidade está

associada ao envelhecimento em indivíduos saudáveis, assim como a uma série de

patologias, incluindo o câncer.

Objetivo: Estudar como o MC, a ativação da imunidade e o tabaco estão

relacionados ao risco de CP em um estudo caso-controle aninhado à coorte do EPIC

( European Prospective Investigation into Cancer and Nutrition).

Métodos: Para avaliar se os níveis plasmáticos de cotinina são um bom biomarcador

da exposição ao tabaco, foram utilizados modelos lineares generalizados. Para

avaliar os efeitos do tabaco, do MC e da ativação da imunidade no risco de CP,

foram aplicados modelos de equações estruturais (MEE) de duas maneiras diferentes

(com e sem variáveis latentes).

Resultados: Com base nas respostas aos questionários de qualidade de vida, com

relação às questões sobre fumo ativo e passivo, a cotinina se mostrou um bom

biomarcador de exposição recente ao tabaco (tanto o aumento da exposição passiva

quanto ativa foram significativas, P<0,001 e P<0,001 respectivamente). Em um MEE

com variáveis observadas, incluindo o MC e a via de ativação da imunidade, a

metionina e o folato como causas proximais apresentaram uma forte e inversa

associação com o risco de CP. O aumento em um desvio-padrão nos níveis séricos de

metionina e de folato significou uma redução no risco de 19% (P<0,01) e 12%

(P=0,03) respectivamente. Em um MEE com variáveis latentes (cada uma

representando o conjunto de vitaminas e aminoácidos importantes para promover:

metilação de DNA, síntese de núcletídeos e imune ativação), foram encontrados

efeitos protetores diretos da metilação do DNA (P=0,018) e da imune ativação

(P=0,037); por outro lado, a síntese de nucletídeos não apresentou efeito no risco do

câncer (P=0,098). Nas duas abordagens de MEE o cigarro permaneceu como a causa

de maior impacto.

Conclusões: A cotinina mostrou-se um bom biomarcador da exposição ao tabaco

(ativa e passivamente). Confirmou-se que a via de metilação é um fator de proteção

contra o CP. A ativação da imunidade apresentou um efeito direto de proteção contra

o CP no modelo com variáveis latentes, equanto que, a síntese de nucletídeos não

apresentou relação com o CP. O tabaco continua sendo o fator de maior impacto no

risco de CP.

Descritores: câncer de pulmão, metilação, síntese de nucleotídeos, ativação da

imunidade, inflamação, modelos de equações estruturais, modelo latente.

ABSTRACT

Baltar VT. Structural equation models applied to lung cancer causal models. São

Paulo (BR); 2011. [PhD thesis – Faculdade de Saúde Pública da Universidade de São

Paulo, Brazil]

Background: Lung cancer (LC) continues to be the most common cancer death in

the world. Tobacco exposure continues to be the most important cause. In addition,

micronutrient intake has been linked to LC, because they are the main source of

vitamins and amino acids involved in the one-carbon metabolism (OCM) which is

considered key in maintaining DNA integrity, regulating gene expression, and may

thus affect carcinogenesis. Immune activation is involved in the aging process in

normal healthy individuals as well as in a number of pathologies, including cancer.

Objectives: To investigate how OCM, immune activation and tobacco are related to

LC incidence in a nested case-control study from the European Prospective

Investigation into Cancer and Nutrition (EPIC) cohort.

Methods: To validate plasma cotinine levels as a good biomarker for tobacco

exposure, a generalized linear model was applied. To evaluate the effects of tobacco,

OCM and immune activation in LC, structural equation models (SEM) were applied

in two different ways.

Results: Based on questions about smoking, passive smoking and number of

cigarettes smoked, it was shown that cotinine is a good biomarker for tobacco

exposure (passive and active exposure with significant relation, p<0.001 and

P<0.001, respectively). In a SEM model with only observed variables, including

OCM and immune activation, methionine and folate as proximal causes presented a

strong and inverse relation with LC risk. An increase in one standard deviation of

serum levels of methionine and folate meant a 19% (P<0.01) and 12% (P<0.01)

reduction in LC risk, respectively. In a SEM including latent variables (each one

including vitamins and amino acids important to promote DNA methylation,

nucleotide synthesis and immune activity), a direct and protective effect for DNA

methylation (p=0.018) and immune activation was found (p=0.037), whereas

nucleotide synthesis did not present a significant total effect. In both approaches of

SEM, tobacco exposure remains with the highest impact on LC risk.

Conclusions: It was found that cotinine is a good biomarker of tobacco exposure

(active and passive). It was confirmed that methylation protects against LC. Immune

activation presented a direct protective effect in the latent model, while nucleotide

synthesis was not confirmed to be related to LC risk. Tobacco effect remains as the

factor with highest impact in lung cancer.

Keywords: lung cancer, methylation, nucleotide synthesis, immune activation,

inflammation, structural equation models, latent model.

APRESENTAÇÃO

Esta tese está organizada nos seguintes capítulos: 1) Introdução; 2) Objetivos; 3)

Metodologia; 4) Resultados e discussão; 5) Considerações finais; 6) Referências; e

Anexo. O capítulo de resultados e discussão está apresentado em forma de artigos

científicos. São três artigos, sendo que os dois primeiros já foram submetidos para

publicação em revistas científicas. Após os resultados e discussão dos artigos, há um

capítulo de considerações finais. As referências e o anexo apresentam-se no final da

tese (porém, as referências dos manuscritos encontram-se nos mesmos).

ÍNDICE

1. INTRODUÇÃO

13

1.1. MECANISMOS CAUSAIS EM CÂNCER DE PULMÃO

16

1.1.1. O Tabaco

17

1.1.2. A Metilação de DNA

18

1.1.3. A Síntese de Nucleotídeos

20

1.1.4. A Ativação da Imunidade

20

1.1.5. A Transulfuração

21

1.2. MODELOS CAUSAIS EM EPIDEMIOLOGIA

21

1.3. O MODELO DE EQUAÇÕES ESTRUTURAIS

29

2. OBJETIVOS

34

3. METODOLOGIA

36

3.1. MATERIAL

36

3.2. MÉTODOS

37

4. RESULTADOS E DISCUSSÃO

39

4.1. MANUSCRITO 1

39

4.2. MANUSCRITO 2

59

4.3. MANUSCRITO 3

86

5. CONSIDERAÇÕES FINAIS

105

6. REFERÊNCIAS

108

ANEXO A - Medidas de Sinergia

116

ANEXO B - Cartas do Comitê de Ética em Pesquisa

129

ANEXO C - Curriculum Lattes

131

Lista de Figuras

Figura 1 - Metilação de histonas

19

Figura 2 - Diagrama de caminhos com efeito direto e indireto de X em Y

29

Figura 3 - Diagrama de caminho com três variáveis latentes

31

Figura A1 - Esquematização conceitual de três conjuntos suficientes para

uma doença (ROTHMAN, 1976b)

117

Figura A2 - Esquematização conceitual de quatro classes envolvendo duas

causas componentes para uma doença (ROTHMAN, 1986)

118

Siglas utilizadas

EPIC – European Prospective Investigation into Cancer and Nutrition

MEE - Modelo de equações estruturais

MEMModelo de equações marginais

MLG - Modelos lineares generalizados

13

1. INTRODUÇÃO

Em 2008, no projeto GLOBOCAN (IARC 2008), estimou-se que 12,7% dos

novos casos de câncer eram de pulmão. Aproximadamente 85% dos cânceres,

denominados carcinomas, ocorreram em células epiteliais. Entre 90 e 95% dos

cânceres de pulmão são carcinomas de pequenas células ou carcinomas de células

não-pequenas. O câncer de pulmão de pequenas células, que atinge 10-15% to total

das pessoas com câncer de pulmão, é considerado patologicamente diferente dos

demais tipos por ser biologicamente agressivo, de natureza difusa, com propensão a

metastase precoce e prognóstico desfavorável (WCRF/AICR 2007). O câncer de

pulmão é um tipo de câncer mais comum em países desenvolvidos, devido ao fato de

esses países terem sofrido a epidemia do cigarro mais cedo, e é um dos cânceres que

mais mata, com uma sobrevida média em 5 anos de apenas 10% (WCRF/AICR

2007).

As causas do câncer de pulmão são diversas. Incluem histórico familiar de

câncer, exposição ao tabaco, a agentes infecciosos, a medicação, a radiação, a

químicos industriais e também a agentes carcinogênicos presentes em comidas e

bebidas (WCRF/AICR 2007). Essas causas são conhecidas por influenciarem o

processo carcinogênico devido a modificações na estrutura e função celular.

Cada célula do corpo humano contém o genoma completo dentro de cada gene,

porém é a expressão gênica (processo que ativa ou inativa a informação de um gene)

que controla quais e quando subgrupos de genes serão ativados, permitindo que as

células se diferenciem quanto à estrutura e função (WCRF/AICR 2007, FERRAZ et

al. 2010).

14

Mudanças na expressão gênica contida no DNA são importantes para evolução e

adaptação dos seres vivos; contudo, algumas dessas mudanças podem resultar em

câncer, que se caracteriza pelo crescimento celular descontrolado. A divisão,

diferenciação e a morte celular são processos cuidadosamente regulados para garantir

crescimento, desenvolvimento e funções celulares adequadas (WCRF/AICR 2007).

Todo câncer tem início em uma única célula que perde o controle de seu processo de

replicação e crescimento.

Os avanços no campo da biologia molecular têm ajudado a entender os

mecanismos envolvidos nesses processos celulares. Vários novos campos de

pesquisas se destacam, são os chamados –ômicos. A nutrigenômica estuda os

impactos da nutrição na manutenção da estabilidade genômica e também a influência

do genótipo na determinação da resposta à dieta; a epigenômica nutricional estuda os

perfis de expressão gênica em resposta à nutrição; a transcriptômica nutricional

estuda os perfis de expressão gênica no nível do RNA influenciados pela nutrição; a

proteômica estuda as proteínas que podem ser expressas pelas células; e a

metabolômica estuda os processos metabólicos na célula e a regulagem metabólica

em células e tecidos (WCRF/AICR 2007).

A integridade celular depende de um balanço entre a proliferação e a morte

celular e também uma diferenciação celular apropriada; Dessa forma, alterações

genéticas e epigenéticas são relacionadas ao câncer (FERRAZ et al. 2010). Uma

alteração genética é caracterizada pela mutação gênica, na qual a sequência do

código do DNA é alterada e é passada de célula mãe para filha (na multiplicação

celular, o câncer prolifera). Essa mutação pode ser a consequência de um erro que

não foi reparado na duplicação celular. Uma alteração epigenética é uma alteração

15

que não muda o códico genético, mas também pode ser repassada de célula mãe para

filha. Esse tipo de alteração altera a expressão gênica, ou seja, as células podem

perder suas funções essenciais. Metilação do DNA, acetilação do DNA, mudanças na

homeostase das histonas, micro RNA e estabilidade do DNA são exemplos de

alterações epigenéticas (WCRF/AICR 2007).

Esses dois tipos de alteração são influenciados por causas ambientais. Para o

câncer de pulmão, a causa ambiental mais convincente é a exposição aos químicos

do tabaco. Estima-se que o cigarro (fumo voluntário ou involuntário) seja

responsável por 85% dos casos de câncer de pulmão (WHO 2006). Outras causas

químicas, como a exposição ao arsênio, também são bem estabelecidas. Além dessas

causas, fatores ligados a qualidade de vida vêm sendo bastante estudados, tais como

atividade física e fatores nutricionais (WCRF/AICR 2007, MARCHIONI et al.

2008). STEFANI et al. (2008) concluíram, em um estudo caso-controle de homens

uruguaios, que um padrão nutricional rico em anti-oxidantes (que incluiu também

marcadores de frutas e vegetais) protege contra o câncer de pulmão entre ex-

fumantes (essa evidência não foi encontrada para fumantes, sugerindo que fumantes

extremos confundiram esse efeito) e, por outro lado, um padrão nutricional rico em

carnes indicou maior risco, sendo que esses padrões foram elaborados com base em

questionário de frequência alimentar e análise fatorial. Outro fator importante é a

infecção por vírus, parasitas e bactérias, que podem estar ligados ao câncer, devido a

danos no DNA.

Este estudo objetiva avaliar os efeitos das vitaminas e aminoácidos ligados a uma

série de reações químicas que acabam por afetar fatores genéticos e epigenéticos

ligados ao câncer. Para tanto, foi analisada uma base de dados de um estudo caso-

16

controle aninhado à coorte do “European Prospective Investigation into Cancer and

Nutrition” (EPIC). A importância da identificação de causas de alterações

epigenéticas é que estas podem ser reversíveis. Além do efeito do cigarro, que é a

causa de maior risco atribuível e que é incluído no estudo medindo-se o efeito da

cotinina (biomarcador de exposição à nicotina – manuscrito 1), dois novos modelos

de estimação do risco de câncer de pulmão são propostos em dois artigos

separadamente (manuscritos 2 e 3).

Este trabalho justifica-se pela importância da identificação de causas para uma

doença tão prevalente e com elevada mortalidade como é o câncer de pulmão. A

inclusão do tabagismo, reconhecido pela comunidade científica como uma

importante causa do câncer de pulmão, é também relevante devido à necessidade de

políticas de proibição do fumo em áreas públicas, em razão de seus efeitos em

fumantes passivos (manuscrito 1). A identificação de causas relacionadas à nutrição

é de grande valia para nortear políticas públicas de orientação alimentar. Ressalta-se

que este estudo, além de propor MEE para confirmação de causas do câncer de

pulmão, mostra a importância de técnicas que abranjam não somente as causas

diretas, mas importantes cofatores causais que ajudam no entendimento do

mecanismo causal envolvido no processo de saúde-doença (manuscritos 2 e 3).

1.1 MECANISMOS CAUSAIS EM CÂNCER DE PULMÃO

Consideram-se quatro mecanismos que podem estar ligados ao risco de câncer

de pulmão: a alteração epigética de metilação de DNA, que quando muito baixa

17

(globalmente) ou muito alta (em um gene específico) pode desproteger ou silenciar

os genes; a síntese de nucleotídeos (renovação celular), a ativação da imunidade, que

está ligada a processos infecciosos e inflamatórios, e a transulfuração, que pode

influênciar nos níveis de homocisteína e na síntese do antixidante glutationa. Além

desses, o tabaco, sendo a causa de maior impacto no risco do câncer de pulmão, com

um risco atribuível de 85%, não pode deixar de ser considerado.

1.1.1 O Tabaco

O cigarro contém pelo menos 80 tipos de sustâncias carcinogênicas e

mutagênicas, incluindo arsênio, cádmio, amônia, formadeído e benzopireno

(WCRF/AICR 2007). Cada um desses químicos tem um mecanismo diferente na

causa do câncer. O benzopireno, por exemplo, pode formar adutos de DNA (em

inglês: “DNA adducts”) em células epiteliais do pulmão. Esses adutos alteram a

estrutura e interrompem a multiplicação do DNA, causando mutação e até supressão

de material genético.

Apesar de o risco atribuído ao cigarro ser bastante alto, apenas 10-15% dos

fumantes desenvolvem o câncer de pulmão. Isso sugere que há uma variação na

susceptibilidade individual para se adquirir a doença (LO et al. 2010). É possível que

alguns polimorfismos tenham um efeito na capacidade de reparo do DNA, mudando

a susceptibilidade para esse câncer. LO et al. (2010) encontraram uma interação entre

altos níveis de exposição passiva ao tabaco e o polimorfismo do gene MLH1-

93A>G, em pessoas que nunca fumaram. Os autores advertem que há uma

possibilidade de que essa associação seja resultado de uma metilação aberrante com

18

consequente silenciamento do gene, mas que esse estudo é mais uma evidência que

se soma, sugerindo que o câncer de pulmão entre aqueles que nunca fumaram

apresenta uma etiologia e uma história natural diferentes. LO et al. (2010) sugerem

que indivíduos com esse polimorfismo possivelmente sejam suscetíveis a contrair

esse câncer após baixos níveis de exposições a fatores carcinogênicos. Em um estudo

de meta-análise (JI et al. 2010), o polimorfismo APE1 Asp148Glu não apresentou

associação com o risco de câncer de pulmão entre asiáticos e brancos, porém essa

associação foi significativa entre fumantes.

1.1.2 A Metilação de DNA

A metilação do DNA é uma reação química que adiciona um grupo metil (-CH3)

a proteína no núcleo do DNA (a proteína mais comum é a histona). Essa adição do

metil à histona é uma reação normal que deve ser mantida em equilíbrio. O metil

adicionado à histona, que é envolta pela cromatina, protege o núcleo do DNA de

ataques de vírus ou bactérias. Por outro lado, quando a metilação é exagerada,

condensa a cromatina, deixando a histona inacessível, e isso pode prejudicar a

expressão gênica (Figura 1). A principal consequência da hiper-metilação do DNA é

que, se regiões promotoras são atingidas, genes supressores de tumores podem ficar

inativos (silenciados). A hiper-metilação pode também prejudicar a capacidade de

reparação do DNA (DAS E SIGNAL 2004, STOVER 2009, ULRICH et al. 2008).

A metilação do DNA tem, como doador universal de metil, o cofator enzimático

S-adenosilmetionina, que é formado a partir do aminoácido metionina. A principal

fonte natural de metionina são as proteínas das carnes, castanhas e sementes de

index-20_1.jpg

19

hortaliças, que devem ser repostas diariamente. Outra forma de se obter metionina é

pela re-metilação de homocisteína, produzida no corpo, que recebe o grupo metil do

folato (vitamina B9), na forma 5-metil tetrahidrofolato, ou da Colina (Betaína). A

doação do metil pelo folato depende da presença de vitamina B12. Esse processo é

conhecido como ciclo do carbono, que envolve dois ciclos: ciclo do folato e ciclo da

metionina-homocisteína. A Figura 1 ilustra a transcrição da cromatina, que tende a

ser hiper-metilada ou hipo-metilada. Se o gene for silenciado, esse silenciamento

(inativação do gene) será passado para as células filhas (DAS e SINGAL 2004).

Figura 1. Metilação de histonas (RL-UFL 2011)

20

1.1.3 A Síntese de Nucleotídeos

A síntese de nucleotídeos, bases nitrogenadas, de purinas (adenina e guanina

encontradas em DNA e RNA) e pirimidinas (uracila encontrada em RNA e tRNA,

citosina em DNA e RNA e timina em DNA e tRNA) são importantes porque são

fonte de energia para diversas reações. O ácido fólico, quando ingerido e

transformado em tetrahidrofolato, recebe um grupo metil da serina (que se

transforma em glicina) e fica na forma 5,10-metil-tetrahidrofolato. Essa forma de

folato é essencial para converter uracila em timidina (dUMP em dTMP), através da

enzima timidilato sintetase. Essa síntese é importante para evitar o acúmulo de

uracila no DNA, que é mutagênica (VISNES et al 2009, FENECH 2010). O excesso

de uracila pode gerar sequências equivocadas do tipo U:G, em vez de U:T que, se

não reparadas, geram mutação (VISNES et al 2009, FENECH 2010).

1.1.4 A Ativação da Imunidade

Vírus, bactérias e parasitas podem estar associados ao câncer, devido à

possibilidade de causarem dano ao DNA. Alguns vírus podem atuar no DNA,

bloqueando a ação de genes supressores tumorais, e também podem desencadear a

ativação de proto-oncogeneses em oncogenes (alteração do proto-oncogenes, que

têm a função de controlar a divisão celular). Além disso, a resposta à infecção é a

inflamação, que, em sua fase aguda, pode até ser benéfica, mas, quando crônica,

pode resultar em dano ao DNA. Um ambiente inflamado está propenso a proliferação

e diferenciação celular (WCRF/AICR 2007).

21

1.1.5 A Transulfuração

A transulfuração também faz parte do metabolismo do carbono. A homocisteína

quando não é usada na re-metilação da metionina, pode ser utilizada na síntese de

cistationina. Para tanto a serina é necessária para o transporte do carbono para a

homocisteína e a vitamina B6 participa como cofator pelo fato da enzima cistationina

β-sintetase ser dependendte dela. Posteriormente a cistationina é usada para síntese

de cisteína com vitamina B6 como cofator enzimático. A importância dessa parte do

metabolismo do carbono deve-se ao fato do aminoácido cisteína ser essencial pra

síntese do antixidante glutationina. Quando a cisteína não é obtida pela dieta, é

importante que a via de transulfuração esteja ativa (DAVIS et al 2006).

1.2 MODELOS CAUSAIS EM EPIDEMIOLOGIA

A inferência causal em saúde é de interesse de médicos, epidemiologistas,

filósofos, sociólogos, e estatísticos. Nas últimas décadas, houve um aumento da

contribuição destes últimos no desenvolvimento de métodos epidemiológicos,

devido, principalmente, aos avanços computacionais, que facilitam a aplicação de

técnicas mais complexas de análise. Modelos lineares, modelos lineares

generalizados, modelos não lineares, entre outros, são bastante usuais entre

epidemiologistas que buscam associar fatores de risco às doenças. Entretanto, nas

revistas científicas mais importantes em epidemiologia, os modelos causais gráficos

(diagramas de caminho) (PEARL 1995, WRIGHT 1921), o modelo de conjuntos

22

suficientes de causas componentes de ROTHMAN (1976a, 1976b, 2002), o modelo

contrafactual ou de “resposta-potencial” (no inglês: conterfactual ou potencial

outcome, LITTLE e RUBIN 2000, MALDONADO e GREENLAND 2002,

GREENLAND e BRUMBACK 2002) e os modelos de equações estruturais (MEE)

(JÖRESKOG 2002, BOLLEN 1993, MUTHÉN e SATORRA 1995, SKRONDAL e

RAB-HESKETCH 2004) têm se destacado na discussão sobre causalidade.

Em 1918, Sewall Wright propôs o método de coeficientes do diagrama de

caminhos, publicado de forma mais completa em 1921, no livro “Correlação e

Causação” (do inglês: Correlation and Causation) (WRIGHT 1921). Wright montou

um sistema biológico completo, no qual “todas” as causas relevantes foram incluídas.

O modelo serve não só para confirmar os fatores causais hipotetizados, como

também para medir seus efeitos, e, segundo o autor, não deve ser usado para

descobrir causas. Wright foi ignorado por seus contemporâneos e fortemente

criticado por Ronald A. Fisher (citado por YU 2007) e pelo filósofo Henry E. Niles

(NILES 1922), que diziam que o modelo de caminhos assume uma estrutura causal a

priori, mas não propõe um mecanismo de identificação de fatores causais relevantes

e, por isso, não poderia ser considerado um modelo causal verdadeiro.

WRIGHT (1921) argumentou que até então a correlação de Pearson era uma

estatística simétrica, uma covariação não direcionada: A↔B, e que em modelos

causais isso deveria ser mudado. Com base em variáveis biológicas cujas relações

sabia serem sequências irreversíveis, ele deduziu uma direção causal: A

B (A

causa B). O coeficiente de caminho proposto por ele era simplesmente o coeficiente

de regressão padronizado (coeficiente de correlação parcial). Sua publicação

formalizou o diagrama de caminhos com um conjunto de equações simultâneas.

23

Com a descrença no método proposto por Wright, tanto pela escola de Pearson,

que buscava a descrição das relações sem se preocupar com as causas, como pela de

Fisher, que, nessa época, estava fortemente interessada em estudos experimentais

aleatorizados, não apreciando um método que se baseava “apenas” no coeficiente de

correlação de Pearson, os diagramas de caminhos ficaram esquecidos (YU 2007).

O redescobrimento do modelo de caminhos deu-se em 1964, quando o sociólogo

Hubert Blalock (citado por YU 2007) usou correlações parciais para analisar relações

causais em estudos sociológicos. Em 1970, na “Conferência de sociólogos em

Madison” em Wisconsin, Joreskog apresentou a ideia de Equação estrutural linear,

que acabou se materializando no software LISREL, o primeiro software para análise

de MEE.

Em 1979, David A. Kenny publicou o livro de MEE intitulado “Correlação e

Causalidade” (em inglês: “Correlation and Causality”), no qual não especificou

nenhuma técnica de descoberta de causas; argumentou que, antes de se testar o

modelo, a estrutura causal deve estar pré-especificada e com referência às teorias a

priori. “MEE requer uma mistura entre matemática e teoria. Apesar de haver

questões matemáticas muito interessantes nesses modelos, as questões mais difíceis

são aquelas que traduzem a teoria em equações. A teoria especifica a forma das

equações” (KENNY 1979). Dessa forma, um modelo causal tem como etapa mais

importante a formulação do modelo teórico a priori e, a partir daí, os efeitos podem

ser medidos quantitativamente.

A partir da década de 1980, os MEEs passam a ser utilizados como modelos

causais, cujas equações são assimétricas (JAMES et al. 1982). A equação Y=a+bX

representa uma função de causa-efeito, onde X’s são as causas e Y o efeito. A teoria

24

tem um papel fundamental na formulação da ordem causal e pode ser usada para

identificar variáveis relevantes em um sistema completo no qual todas as causas são

incluídas. Os MEEs testam, confirmam uma teoria causal, mas não a descobrem. E o

modelo é dito confirmado quando é consistente com os dados (no caso dos MEEs,

ser consistente significa que a matriz de correlação observada não difere muito da

proposta pelo modelo) (MELHADO 2009).

Os MEEs utilizam os diagramas de caminho como um auxílio para formulação

teórica dos modelos. Em epidemiologia, os modelos gráficos de caminho foram

popularizados por GREENLAND e BRUMBACK (2002), GREENLAND et al.

(1999), PEARL (1995, 2000) e ROBINS (2001). Usualmente, esses gráficos são

representados por letras e setas. As pontas das setas ligam-se às variáveis,

representadas por letras, ditas efeitos; e as caudas conectam-se as variáveis chamadas

de causas.

Esses diagramas são extremamente úteis para visualização de relações causais,

que podem ser diretas, ou podem apresentar um efeito mediador. O efeito mediador,

Z, é efeito de uma causa anterior e é causa de um efeito seguinte: X Z Y. Quando

os caminhos não se fecham, ou seja, não é formado um ciclo, não há um caminho

que comece e volte para uma mesma variável, e, se as sequências são diretas, ou seja,

se o efeito de uma sequência é a causa da sequência seguinte, formam-se os

chamados gráficos acíclicos diretos (em inglês, DAGs: “direct acyclic graphs”).

Não é necessário que se incluam todas as causas no diagrama, mas, se duas ou mais

variáveis do gráfico têm a mesma causa, essa causa deve estar no gráfico como uma

causa de ambas, se não o gráfico pode ser considerado não causal (GREENLAND e

BRUMBACK 2002).

25

Os diagramas de caminhos são uma forma simples e de fácil compreensão para

representar as direções causais e também a independência entre as variáveis. Porém,

havia necessidade de uma maior formalização quantitativa, com suposições mais

fortes desses modelos gráficos, que eram até então mais filosóficos do que

estatísticos. No início do século XX, Neyman e Fisher propuseram o modelo

contrafactual ou de resposta-potencial (citado por LITTLE e RUBIN 2000). Segundo

MACMAHON e PUGH (1967, pg 12), “...uma associação pode ser classificada

presumptivamente como causal quando acredita-se que, se a causa (exposição) for

alterada, o efeito teria mudado”. Essa frase descreve o elemento contrafactual, que

seria o que teria acontecido se, ao contrário do fato, a exposição tivesse sido outra

diferente do que ela realmente foi (GREENLAND E BRUMBACK 2002). A

resposta potencial para um indivíduo i e tratamento (exposição) x j é a resposta que o

indivíduo teria no momento do tratamento, dado que esse tratamento existe, mesmo

que o indivíduo de fato não tenha recebido esse tratamento (resposta potencial do

indivíduo i sob tratamento x j) (GREENLAND e BRUMBACK 2002). Essa

pressuposição é controversa, devido ao fato de que só é possível observar essa

resposta naqueles que de fato receberam o tratamento (as demais respostas, para os

que não receberam tratamento, podem ser apenas estimadas, e não observadas). Essa

necessidade de premissas que não podem ser testadas é desconfortável, mas os

especialistas em modelos contrafactuais se defendem, dizendo que é um problema

geral de inferência causal, sendo que, em modelos contrafactuais, esse problema é

colocado de forma explícita (GREENLAND E BRUMBACK 2002, MALDONADO

e GREENLAND 2002, GREENLAND et al. 1999). Para que esse tipo de modelagem

possa ser utilizado na prática, faz-se uso da teoria da probabilidade, estimando-se, a

26

partir de uma amostra aleatória, a distribuição da resposta em uma população em

diferentes níveis do tratamento ou da exposição, da mesma maneira como é feito em

modelos estatísticos usuais (GREENLAND e BRUMBACK 2002).

Com o início de estudos das doenças degenerativas e com o abandono de

estudos epidemiológicos unicausais, o conceito de interação passou a ocupar uma

posição bastante central nas discussões de causalidade. Três tipos de interação se

destacaram: i) interação estatística; ii) interação por excesso de risco; e iii) interação

biológica (GREENLAND e BRUMBACK 2002). i) a interação estatística estará

sujeita ao tipo de modelo estatístico utilizado, ela pode ser um efeito multiplicador

ou aditivo, dependendo da função de ligação adotada no modelo linear; ii) a

interação por excesso de risco pode ser diretamente acessada apenas em modelos que

não façam uso de transformação logarítmica; assim, o excesso de risco é aditivo e

não multiplicativo. Em um modelo de regressão logística, por exemplo, o acesso à

interação por excesso de risco pode ser feito com o auxílio de estatísticas de sinergia

(ver Anexo); E por fim, iii) a interação biológica, que é a mais complicada delas,

visto que a medida do excesso de risco (sinergia) pode ajudar a identificá-la, mas

uma interação biológica é um mecanismo que ocorre no nível individual, mesmo que

ocorra uma anulação dos riscos quando a medida é multiplicativa ou de outra

natureza, nada garante que a interação biológica ocorre para alguns indivíduos

(GREENLAND 2009). O modelo de Rothman, que considera conjuntos suficientes

de causas componentes é o modelo, com base em mecanismo causal, mais famoso

em Epidemiologia. Rothman usa a ideia de excesso de risco em modelos aditivos

para acessar a interação biológica, mas há autores que julgam esse termo “biológico”

equivocado, e preferem chamar a sinergia de excesso de risco devido à interação

27

(GREENLAND 2009). Esse modelo tem como base o mecanismo de interação, a

sinergia entre causas (ROTHMAN 1974, 1976a), que são necessárias juntas para que

o mecanismo opere e produza a doença em questão (GREENLAND e BRUMBACK

2002).

Essa definição do modelo, com base em mecanismos causais, é elaborada no

nível individual, similarmente aos modelos de respostas potenciais. Então, diferentes

grupos de mecanismos determinam respostas potenciais para os indivíduos. Na

prática, o modelo de conjuntos suficientes de causas componentes não será

totalmente determinístico, visto que cada causa componente será assumida como

sendo variável aleatória (POOLE 2001).

A formalização do modelo causal de Rothman deu-se em 1976, quando ele

publicou a primeira proposta de estimação da sinergia (ROTHMAN 1976a) e

também a formalização do modelo nos gráficos de pizza (ROTHMAN 1976b) no

artigo ‘Causas’ (‘Causes’). Toda a filosofia desse modelo teórico de conjuntos

suficientes é baseada na teoria desenvolvida pelo filósofo australiano John Mackie,

intitulada condição INUS, das iniciais em inglês: “Cause is an insufficient but

necessary part of a condition which is itself unnecessary but sufficient for the result”

(MACKIE 1965, 1974).

No seu modelo de conjuntos suficientes de causas componentes ROTHMAN

(1976b), define um conjunto de causas suficientes como um grupo de condições ou

acontecimentos, não supérfluos, que produzem a doença. Completar um conjunto

suficiente desencadeia a doença. Em biologia, muitas vezes, esses conjuntos nem são

conhecidos. Há de se pensar, então, que existe uma interação biológica entre causas,

que tem um efeito em indivíduos suscetíveis a essas causas, e que,

28

consequentemente, desenvolverão a doença. Como muitas causas não são

conhecidas, o melhor que se pode fazer é avaliar o valor médio do risco para os

expostos a um padrão dado de indicadores de risco conhecidos. Essas causas que

formam o conjunto chamado de suficiente são ditas causas componentes. Algumas

das causas componentes podem pertencer a diferentes conjuntos suficientes.

Algumas causas componentes podem estar presentes em todos os conjuntos

suficientes alternativos, e, quando isso ocorre, Rothman chama essas causas de

necessárias.

O mecanismo que Rothman propõe, ressaltando a importância de se avaliar o

efeito de duas causas conjuntas e indicando que ambas, concomitantemente,

apresentam um risco diferente do que seria observado com as causas em separado

nem sempre é relevante. No caso do câncer de pulmão, há um crescente interesse nos

efeitos de fatores ligados à nutrição, que, depois dos efeitos de misturas químicas,

como os efeitos do tabaco, vêm mostrando uma forte relação com a incidência da

doença (FERRAZ et al. 2010; BALUZ et al. 2002). Essas reações não ocorrem

conjuntamente, mas são uma sequência bem estabelecida de reações químicas

(estudos laboratoriais ajudam a entender essas reações). Nesse caso, a importância

dos diagramas de caminho, juntamente com a estimação dos efeitos causais, parece

mais importante do que o modelo de causas componentes suficientes de Rothman. O

MEE é o método mais apropriado para estimação dos efeitos dessas cadeias de

reações estabelecidas a priori, com a vantagem de poder incluir as variáveis em sua

forma contínua, sem a necessidade de categorização para avaliação de risco, como é

necessário para as estatísticas de sinergia.

index-30_1.png

29

1.3 O MODELO DE EQUAÇÕES ESTRUTURAIS

O MEE, de uma maneira geral, usa os diagramas de caminho como uma forma

mais simples de entender as relações causais que são baseadas em teorias. A

diferença de um modelo de regressão tradicional para um MEE é que, neste, os

fatores de risco podem afetar a variável resposta direta e/ou indiretamente. O modelo

de caminho mais simples é X→Y, que equivale a uma regressão do tipo Y=α+βX+ε.

Um caminho incluindo um efeito indireto de X via Z (variável mediadora ou

intermediária) está representado na Figura 2. Esse modelo precisa de duas equações

para ser representado matematicamente, visto que há duas variáveis resposta (o

número de equações coincide com o número de variáveis resposta). A primeira

regressão mede os efeitos de X em Z: Z=α0+α1X+ε. A segunda mede o efeito direto

de X em Y e o efeito de Z em Y: Y=β0+β1X+β2Z+ε.

Figura 2. Diagrama de caminhos com efeito direto e indireto de X em Y

As duas regressões representam um único modelo causal, por isso devem ser

estimadas simultaneamente. Assumindo que os erros são estatisticamente

independentes,

essas

duas

equações

podem

ser

estimadas

por:

Y=β0+β1X+β2(α0+α1X)+ε= (β0+β2α0)+(β1+β2α1)X+ε. O modelo representado na

Figura 2 pode, então, ser estimado com base apenas na variável X (equação na forma

30

reduzida) (RETHERFORD e CHOE 1993). O efeito β1 é chamado de efeito direto de

X em Y (caminho simples ou direto); o produto β2α1 é o efeito indireto de X em Y

(caminho composto) e a soma β1+β2α1 é o efeito total de X em Y.

A inclusão de variáveis de controle nas equações de regressão que compõem o

sistema de equações consideradas para MEE pode ser feita de regressão em regressão

(para cada variável resposta há a possibilidade de controle por algum fator), sendo

que não são ilustradas nos diagramas de caminho, pois não são considerados fatores

causais.

Esse tipo de modelo, utilizando apenas variáveis observáveis, é conhecido como

modelo estrutural. Um MEE pode apresentar, também, uma abordagem não

estrutural, conhecida como modelo de mensuração, que utiliza variáveis observáveis

para estimar variáveis que não são diretamente observáveis, as variáveis latentes

(ALENCAR 2009, MELHADO 2009). Um MEE completo apresenta essa duas

partes: estrutural e de mensuração.

Modelos de variáveis latentes são muito usuais em psicologia, pois usam

constructos para compor indicadores que não podem ser observados diretamente.

Esse tipo de modelagem é bastante semelhante a análise fatorial, mas é uma análise

confirmatória, pois as correlações entre os itens que irão compor as variáveis latentes

são estipuladas a priori (LONG 1983). O MEE testará se essas suposições se

confirmam.

Quando um MEE inclui essas duas partes da modelagem, geralmente as variáveis

latentes são representadas por círculos nos diagramas de caminho, e as variáveis

observadas são representadas por retângulos. Na Figura 3, está representado um

MEE com três variáveis latentes: F1, F2 e F3. F1 é composta por três variáveis

index-32_1.png

31

observáveis: A, B e C. F2 é composta por C, D e E. F3 é composta por C, E e F.

Nesse modelo, não é hipotetizado que as variáveis latentes são correlacionadas entre

si (flechas duplas representariam essa correlação: ↔). Os erros Er3 e Er4 apresentam

correlação. O evento final é a ocorrência da doença, que é uma variável observada, e

apresenta um erro de mensuração: Er.

Figura 3. Diagrama de caminho com três variáveis latentes

Esses modelos foram desenvolvidos inicialmente para variáveis observáveis

quantitativas e depois também para variáveis categorizadas. Em saúde, é comum

tratar-se da ocorrência ou não de um evento, e a combinação de MEE com modelos

lineares generalizados é bastante prática. Essa parte da discussão refere-se à

estimação do modelo, mas antes disso é necessário um comentário sobre

identificabilidade. A identificabilidade do modelo é o primeiro passo que deve ser

levado em consideração e consiste em saber se a solução alcançada é única ou não.

Um modelo não identificável pode não ter solução ou ter muitas (pode apresentar,

32

por exemplo, infinitos valores para seus parâmetros), mas o modelo identificável terá

apenas uma solução. Quando ocorre uma estimação que é não identificável, esse

modelo não faz sentido, a interpretação de seus parâmetros pode ser absurda.

Algumas restrições podem ser impostas ao modelo para garantir a sua

identificabilidade. Sendo o modelo identificável, parte-se para estimação

(ALENCAR 2009, MELHADO 2009). No software Mplus, escolhido para análise

dos dados desta tese, a estimação de MEE permite o uso de variáveis observáveis do

tipo contínuo, binário, ordinal, nominal e de contagem. As variáveis latentes podem

ser do tipo contínuo ou categórico. Para as variáveis resposta contínuas, são

utilizados modelos de regressão linear. Para variáveis respostas binárias ou

categóricas ordinais, são utilizadas regressões logísticas e probito. No caso de

variáveis respostas nominais, usa-se regressão logística multinomial e, para respostas

do tipo contagem, regressão de Poisson ou binomial negativa (com ou sem zero

inflacionado).

Como os MEEs baseiam-se na estrutura de correlação observada, a definição

correta do tipo de variável é importante para que as correlações apropriadas sejam

utilizadas na matriz de correlação observada. No Mplus, a matriz de correlação usa a

correlação apropriada para cada par de variáveis analisado. A correlação de Pearson

é usada entre duas variáveis contínuas; a correlação “tetrachonic” (HARRIS, 1988) é

utilizada entre duas variáveis binárias; a correlação “polychoric” (JÖRESKOG,

2002) é usada entre uma variável binária e uma ordinal; a correlação “polyserial”

(DRASGOW, 1988) é usada entre uma variável contínua e outra ordinal; e a

correlação “biserial” (KRAEMER, 1982) quando uma variável é contínua e a outra

binária.

33

Neste estudo, optou-se pela utilização de modelos lineares generalizados,

especificamente para o uso da distribuição binomial (foram utilizadas as funções de

ligação logito e também a probito, que facilitam a interpretação para resposta binária)

para estimação dos efeitos proximais na ocorrência do evento.

34

2. OBJETIVOS

O principal objetivo deste estudo é avaliar a plausibilidade de causas nutricionais,

além do efeito do tabaco, no risco de câncer de pulmão em um estudo caso-controle

aninhado à coorte do “European Prospective Investigation into Cancer and

Nutrition” (EPIC). Para tanto, aplica-se MEE visando a estabelecer esse método

como um bom instrumento para confirmação de teorias causais.

Com esse objetivo, separadamente para cada um dos manuscritos apresentados

nos resultados deste estudo, tem-se:

Manuscrito 1: justificar o uso de um biomarcador, a cotinina, como uma boa

opção de medida de exposição à nicotina (ativa e passivamente). Verificar se o

mesmo está relacionado às categorias de tabagismo atual (nunca fumou, ex-fumante

e fumante), ao número médio de cigarros fumados por dia (para fumantes) e ao

número de horas de exposição passiva (para não fumantes), controlando-se

potenciais confundimentos.

Manuscrito 2: avaliar os efeitos de substâncias presentes no sangue humano,

devido a fatores nutricionais, no risco de câncer de pulmão. Essas substâncias são

relacionadas ao metabolismo do carbono (ciclo do folato e ciclo da homocisteína-

metionina), à transulfuração e à ativação da imunidade, além do uso da cotinina

como biomarcador de exposição a nicotina. Neste manuscrito a abordagem

metodológica visa confirmar epidemiológicamente os caminhos causais biológicos

estabelecidos na literatura.

Manuscrito 3: tem por objetivo a avaliação dos efeitos de substâncias, também

colhidas em amostras de sangue antes do aparecimento da doença, no risco de câncer

35

de pulmão. A abordagem metodológica difere do manuscrito anterior pelo fato deste

manuscrito objetivar a estimação de variáveis latentes que representam conjuntos de

variáveis teoricamente relacionadas à: metilação do DNA, síntese de nucleotídeos e

imune ativação, além da cotinina que entra no modelo como biomarcador de

exposição ao tabaco.

36

3. METODOLOGIA

3.1. MATERIAL

O estudo EPIC é uma coorte prospectiva que envolve 10 países: França,

Alemanha, Grécia, Itália, Holanda, Espanha, Reino Unido, Suécia, Dinamarca e

Noruega. São 23 centros espalhados nesses 10 países que colaboram com a pesquisa.

O recrutamento de voluntários ocorreu entre 1992 e 2000 e um questionário sobre

fatores da dieta e de estilo de vida foi aplicado. Além disso, os voluntários tiveram

suas medidas antropométricas anotadas e também uma amostra de sangue coletada.

O estudo foi aprovado por todos os comitês de ética locais e também pela Agência

Internacional para Pesquisa em Câncer (IARC). Os participantes dessa coorte são

acompanhados em intervalos de tempo regulares e suas informações são atualizadas.

Essa coorte tem 519.978 participantes recrutados e informações sobre novos casos de

câncer e outras doenças são constantemente atualizadas, incluindo a mortalidade.

Informações sobre as amostras de sangue foram coletadas para uma grande parte da

coorte e mantidas congeladas para futuras análises. RIBOLI et al (2002) publicaram

uma descrição completa sobre a população estudada e a coleta de dados do estudo

EPIC.

Este estudo utiliza uma subamostra, que é um estudo caso-controle aninhado a

coorte do EPIC. As amostras de sangue dos casos e de seus respectivos controles

foram analisadas simultaneamente. As análises séricas e plasmáticas, das variáveis

estudadas, foram análisadas pelo laboratório Bevital S/A (www.bevital.no).

37

No total da coorte 2.206 casos de câncer de pulmão foram diagnosticados como

incidentes (código C34 que considera os cânceres invasivos, da Classificação

Internacional de Doenças para Oncologia, segunda edição). Indivíduos que não

doaram sangue, ou que não tinham a data da coleta de sangue, ou que tiveram

alguma história de outro câncer (com exceção de câncer de pele, não-melanoma),

foram excluídos. Cada caso teve, no momento do diagnóstico, dois controles livres

de câncer pareados segundo: país, sexo, data da coleta de sangue (±1 mês, flexivel

em até 5 meses, caso não tenha controle disponível) e data de nascimento (±1 ano,

flexível em até 5 anos), para evitar confundimentos (JOHANSSON et al. 2010).

A amostra final, utilizada no presente estudo, que foi aprovado pelo comite de

ética da Faculdade de Saúde Pública da Universidade de São Paulo, tem 2638

indivíduos (891 casos e 1747 controles, sendo que 856 casos permaneceram com o

pareamento 1:2 e 35 casos perderam um de seus controles por apresentarem

problemas na informação em pelo uma das variáveis utilizadas ou na data de coleta

do sangue).

3.2. MÉTODOS

Este estudo faz uso de três diferentes métodos estatísticos de análise dos dados. O

Manuscrito 1 usa modelos lineares generalizados (MLG) para avaliar a relação entre

as categorias de exposição ao tabaco (questionário de qualidade de vida) com os

níveis plasmáticos de cotinina (biomarcador de nicotina). Três subamostras são

analisadas: uma amostra com informação completa (n=859) sobre as questões

relativas ao fumo passivo (exposto ou não); uma amostra de apenas não fumantes

38

com informação de horas de exposição ao fumo passivo (n=107); e uma amostra para

apenas fumantes com informação sobre número médio de cigarros fumados por dia

(n=832). Para essa análise foram considerados MLGs com distribuição gama e

normal ambos com função de ligação identidade.

No manuscrito 2, foram considerados MEEs com variáveis observadas e o

manuscrito 3, MEEs com variáveis latentes. Ambos os manuscritos buscam

descrever diferentes caminhos na causação do câncer de pulmão. Esses dois

manuscritos têm como objetivo relacionar substâncias, medidas nas amostras de

sangue, que possam estar relacionadas com a incidência do câncer de pulmão devido

à sua participação em reações de interesse: metilação do DNA, síntese de

nucleotídeos, transulfuração e ativação da imunidade (uma descrição mais detalhada

das variáveis utilizadas encontra-se nos manuscritos do capítulo de resultados e

discussão).

39

4. RESULTADOS E DISCUSSÃO

4.1. MANUSCRITO 1

Artigo submetido no periódico Cancer Epidemiology, Biomarkers & Prevention.

Smoking, second-hand smoke and cotinine levels in a subset of EPIC

cohort.

Valéria Troncoso Baltar1§, Wei Xun2, Shu-Chun Chuang2, Caroline Relton3, Per

Magne Ueland4,5, Stein Emil Vollset6,7, Øivind Midttun8, Mattias Johansson9, Nadia

Slimani9, Mazda Jenab9, Françoise Clavel-Chapelon10,11,12, Marie-Christine Boutron-

Ruaul10,11,12, Guy Fagherazzi10,11,12, Rudolf Kaaks13, Sabine Rohrmann14, Heiner

Boeing15, Cornelia Weikert15, H. Bas Bueno-de-Mesquita16, Hendriek C

Boshuizen16, Carla H. van Gils17, Petra HM Peeters17, Antonio Agudo18, Aurelio

Barricarte19,23, Carmen Navarro20,23, Laudina Rodríguez21, José Maria Huerta

Castaño22,23, Nerea Larrañaga23,24, Maria José Sánchez Pérez23,25, Kay-Tee Khaw26,

Nick Wareham27, Naomi E. Allen28, Francesca Crowe28, Valentina Gallo2, Teresa

Norat2, Giovanna Tagliabue29, Giovanna Masala30, Salvatore Panico31, Carlota

Sacerdote32, Rosario Tumino33, Antonia Trichopoulou34,35, Pagona Lagiou34,36,

Christina Bamia34, Torgny Rasmuson37, Göran Hallmans38, Nina Roswall39, Anne

Tjønneland39, Elio Riboli2, Paul Brennan9, Paolo Vineis32,40

1Department of Epidemiology, Faculty of Public Health, University of São Paulo,

Av. Dr Arnaldo, 715. CEP 01246-904. São Paulo, São Paulo, Brazil

2Department of Epidemiology & Biostatistics, School of Public Health, Faculty of

Medicine, Imperial College London, St Mary’s Campus, 5th floor, Norfolk Place W2

1PG, London, UK

3Institute for Ageing and Health, Newcastle University, Campus for Ageing and

Vitality, Newcastle upon Tyne, NE4 5PL Newcastle, UK

4Section for Pharmacology, Institute of Medicine, University of Bergen, 9th floor,

New Laboratory Building 5021, Bergen, Norway

5Haukeland University Hospital, Jonas Lies vei 65 N-5058. PO.Box 1, N-5021,

Bergen, Norway

6Department of Public Health and Primary Health Care, University of Bergen,

Postboks 7800, 5020, Bergen, Norway

7Division of Epidemiology, Norwegian Institute of Public Health, Kalfarvejen, 31 N-

5018 Bergen, Norway

8Bevital AS, Laboratoriebygget, 9 etg.,5021 Bergen, Norway

40

9International Agency for Research on Cancer, 150 Cours Albert Thomas, 69372,

Lyon, France

10Institut National de la Santé et de la Recherche Médicale, INSERM U780-IFR169,

16 Avenue Paul Vaillant-Couturier, 94807 Villejuif, France

11Institut Gustave Roussy, 39 rue Camille Desmoulins, 94805, Villejuif, France

12Paris South University, Villejuif, France

13Division of Cancer Epidemiology, German Cancer Research Centre, Im

Neuenheimer Feld 280, 69120 Heidelberg, Germany

14Division of Clinical Epidemiology, German Cancer Research Centre, Im

Neuenheimer Feld 280, 69120 Heidelberg, Germany

15Department of Epidemiology, German Institute of Human Nutrition, Arthur-

Scheunert-Allee 114-116, 14558 Bergholz-Rehbrücke, Nuthetal, Germany

16National Institute of Public Health and the Environment (RIVM), PO Box 1, 3720

BA Bilthoven, The Netherlands

17Julius Center for Health Sciences and Primary Care, University Medical Center

Utrecht, Room Str. 6.131, PO Box 85500, 3508 GA Utrecht, The Netherlands

18Unit of Nutrition, Environment and Cancer, Catalan Institute of Oncology, Gran

Via 199-203, 08907 L'Hospitalet de Llobregat, Spain

19Epidemiology, Prevention and Promotion Health Service, Public Health Institute of

Navarra, Leyre 15, 31003 Pamplona, Navarra, Spain

20Department of Epidemiology, Regional Coucil of Health and Consumer Affairs,

Ronda de Levante 11, Murcia 3008, Spain

21Public Health and Participation Directorate, Health and Health Care Services

Council, C/ Ciriaco Miguel Virgil no 9, CP 33006 Oviedo, Asturias, Spain

22Department of Epidemiology, Murcia Regional Health Authority, Ronda de

Levante 11, Murcia 3008, Spain

23CIBER of Epidemiology and Public Health, C/ Dr. Aiguader, 88, 1a planta –

08003, Barcelona, Spain

24Epidemiology Unit, Public Health Department of Gipuzkoa, Basque Government

Avenida de Navarra, 4-20013 Donostia, San Sebastián, Spain

25Cancer registry of anada, Andalusian School of Public Health, Cuesta del

observatório, 4, 18080, Granada, Spain

26Clinical Gerontology Unit, Department of Public Health and Primary Care,

University of Cambridge, Level 2, F + G Block, Box 251, Addenbrooke's Hospital

Hills Road, CB2 2QQ Cambridge, UK

27MRC Epidemiology Unit, Strangeways Research Laboratory, Strangeways

Research Laboratory, Worts Causeway, Cambridge CB1 8RN, UK

28 Cancer Epidemiology Unit, University of Oxford, Richard Doll Building, Old

Road Campus, OX3 7LF Oxford, UK

29Environmental Epidemiology and Cancer Registry Unit, Fondazione IRCCS

Istituto Nazionale dei Tumori, via Venezian , 1, I - 20133 Milano , Italia

30Molecular and Nutritional Epidemiology Unit, Cancer Research and Prevention

Centre, Scientific Institute of Tuscany, Via Cosimo il Vecchio 2, 50139 Florence,

Italy

31Department of Clinical and Experimental Medicine, Federico II University of

Naples, Via Pansini 5, 80131 Naples, Italy

32Human Genetic Foundation (HuGeF), 52, via Nizza 10123 Torino Italy,

41

33Ragusa Cancer Registry, Azienda Ospedaliera "Civile M.P. Arezzo", Via Dante N°

109, 97100 Ragusa, Italy

34WHO Collaborating Center for Food and Nutrition Policies, Department of

Hygiene, Epidemiology and Medical Statistics, University of Athens Medical School

75 M. Asias Avenue, Goudi, GR-115 27, Athens, Greece

35Hellenic Health Foundation, 10-12 Tetrapoleos Street, GR-115 27, Athens Greece

36Department of Epidemiology, Harvard School of Public Health, Harvard University

677 Huntington Ave, Boston, MA 02115. USA

37Department of Radiation Sciences, Oncology, Umeå University, SE-901 87 Umeå,

, Sweden

38Department of Public Health and Clinical Medicine, Umeå University, SE-90187 ,

Sweden

39Institute of Cancer Epidemiology, Danish Cancer Society, Strandboulevarden 49,

2100, Copenhagen, Denmark

40Department of Epidemiology & Public Health, MRC-HPA Centre for Environment

and Health, Imperial College, Norfolk Place, W2 1PG, London, UK

§Corresponding author

Email addresses: VTB: vbaltar@usp.br, WX: wei.xun06@imperial.ac.uk, SCC: s-

c.chuang@imperial.ac.uk,

CR:

c.l.relton@newcastle.ac.uk,

PMU:

per.ueland@ikb.uib.no, SEV: Vollset@uib.no, ØM: bjorn.midttun@farm.uib.no, MJ:

johanssonm@fellows.iarc.fr, NS: slimani@iarc.fr, MJ: jenab@iarc.fr, FC-C:

clavel@igr.fr, M-CB-R: boutron@igr.fr, GF: guy.fagherazzi@igr.fr, RK:

r.kaaks@dkfz-heidelberg.de,

SR:

sabine.rohrmann@ifspm.uzh.ch,

HB:

boeing@mail.dife.de,

CW:

weikert@dife.de,

HBBd-M:

Bas.Bueno.De.Mesquita@rivm.nl, HCB: Hendriek.Boshuizen@rivm.nl, CHvG:

C.vanGils@umcutrecht.nl,

PP:

P.H.M.Peeters@umcutrecht.nl,

AA:

a.agudo@iconcologia.net,

AB:

abarricg@cfnavarra.es,

CN:

carmen.navarro@carm.es, LR: laudina.rodriguezsuarez@asturias.org, JMHC:

jmhuerta.carm@gmail.com,

NL:

epidem3-san@ej-gv.es,

MJSP:

mariajose.sanchez.easp@juntadeandalucia.es, K-TK: kk101@medschl.cam.ac.uk,

NW: nick.wareham@mrc-epid.cam.ac.uk, NA: Naomi.allen@ceu.ox.ac.uk, FC:

francesca.crowe@ceu.ox.ac.uk,

VG:

v.gallo@imperial.ac.uk,

TN:

t.norat@imperial.ac.uk,

GT:

giovanna.tagliabue@istitutotumori.mi.it,

GM:

g.masala@ispo.toscana.it, SP: spanico@unina.it, CS: carlotta.sacerdote@cpo.it, RT:

rtumino@tin.it, AT: atrichopoulou@hhf-greece.gr, PL: pdlagiou@med.uoa.gr, CB:

cbamia@nut.uoa.gr,

TR:

torgny.rasmuson@onkologi.umu.se,

GH:

goran.hallmans@nutrires.umu.se, NR: roswall@cancer.dk, AT: annet@cancer.dk,

ER: e.riboli@imperial.ac.uk, PB: brennan@iarc.fr, PV: p.vineis@imperial.ac.uk

42

Abstract

Background

Several countries are discussing new legislation on the ban on smoking in public

places, based on the growing evidence of the hazards of second-hand smoke (SHS)

exposure. The objective of the present study is to quantitatively assess the

relationship between smoking, SHS and plasma cotinine levels in the large European

Prospective Investigation into Cancer and Nutrition (EPIC) cohort.

Methods

From a study on lung cancer in the EPIC cohort, questionnaire information on

smoking was collected at enrolment and cotinine was measured in plasma. Three

statistical models were applied considering samples available in a cross-section

design: 1) cotinine levels by categories combining smoking and passive smoking

(n=859); 2) non-smokers only to evaluate the effect of hours of passive smoking

exposure (n=107); 3) current smokers to evaluate the effect of the number of

cigarettes per day (n=832). All models were controlled for country, sex, age and

body mass index.

Results

Amongst non-smokers, passive smokers presented significant differences in cotinine

compared to non-exposed, with a bigger difference among former smokers. A one

hour per day increment of passive smoking gave rise to a significant 2.58 nmol/L

(0.45 ng/mL) mean cotinine increase (P<0.001). In current smokers, a one cigarette

per day increment gave rise to a significant 22.44 nmol/L (3.95 ng/mL) increase in

average serum cotinine (P<0.001).

43

Conclusions

There is clear evidence that not only tobacco smoking but also involuntary exposure

to tobacco smoke increases cotinine levels in plasma, with probably a higher increase

for former smokers.

Impact

This study supports the evidence that there should be a ban on smoking.

Short running title: Exposure of tobacco smoke and cotinine levels

Keywords: smoking, second hand smoke, cotinine.

List of abbreviations

SHS: of second-hand smoke; BMI: body mass index; NeSNP: never-smoker and no-

passive exposure; NeSP: never-smoker and passive exposure; FSNP: former-smoker

and no-passive exposure; FSP: former-smoker and passive exposure; CS: current

smoker EPIC: European Prospective Investigation into Cancer and Nutrition; GLM:

Generalized linear model; BMI: body mass index (in kg/m2).

44