Grupos finitos e quebra de simetria no código genético por Fernando Martins Antoneli Junior - Versão HTML

ATENÇÃO: Esta é apenas uma visualização em HTML e alguns elementos como links e números de página podem estar incorretos.
Faça o download do livro em PDF, ePub, Kindle para obter uma versão completa.

Grupos Finitos e Quebra de Simetria

no Código Genético

Fernando Martins Antoneli Júnior

TESE APRESENTADA

AO

INSTITUTO DE MATEM ÁTICA E ESTATÍSTICA

DA

UNIVERSIDADE DE S ˜

AO PAULO

PARA

OBTENC

¸ ˜

AO DO GRAU DE DOUTOR

EM

MATEM ÁTICA APLICADA

Área de Concentraç˜

ao: Matemática Aplicada

Orientador: Prof. Dr. Michael Forger

Durante a elaboraç˜

ao deste trabalho o autor recebeu apoio financeiro da FAPESP

-S˜

ao Paulo, janeiro de 2003-

Grupos Finitos e Quebra de Simetria

no Código Genético

Este exemplar corresponde à redaç˜

ao final da

tese devidamente corrigida e defendida

por Fernando Martins Antoneli Júnior

e aprovada pela comiss˜

ao julgadora.

ao Paulo, 24 de janeiro de 2003.

COMISS ˜

AO JULGADORA

• Prof. Dr. Frank Michael Forger (orientador) - IME-USP

• Prof. Dr. Francisco Cesar Polcino Milies - IME-USP

• Prof. Dr. Said Najati Sidki - DM-UnB

• Prof. Dr. Norai Romeu Rocco - DM-UnB

• Prof. Dr. José Eduardo Martinho Hornos - IFSC-USP

Resumo

Neste trabalho resolvemos o problema da classificaç˜

ao dos poss´ıveis esquemas de quebra de

simetria que reproduzem as degenerescências do código genético na categoria dos grupos

finitos simples, contribuindo assim para a busca de modelos algébricos para a evoluç˜

ao do

código genético, iniciada por Hornos & Hornos em [80].

Abstract

In this work we solve the problem of classifying the possible symmetry breaking schemes

based on simple finite groups that reproduce the degeneracies of the genetic code, thus

contributing to the search for algebraic models that describe the evolution of the genetic code, initiated by Hornos & Hornos in [80].

Aos meus pais,

Fernando e Eideni.

A evoluç˜

ao pára quando a estupidez n˜

ao é mais fatal.

Autor desconhecido.

Agradecimentos

Ao Prof. Michael Forger, meu orientador, pelo incentivo, confiança, compreens˜

ao,

paciência. A sua experiência como pesquisador e professor tornou poss´ıvel a realizaç˜

ao desta

tese e contribuiu para a minha formaç˜

ao matemática e cultural.

Aos meus pais, Fernando e Eideni, a quem também dedico este trabalho, pelo apoio

e compreens˜

ao desde que eu decidi seguir a carreia acadêmica.

Aos membros da banca examinadora, pelas correç˜

oes e sugest˜

oes que que ajudaram

a aumentar a legibilidade e corretude e precis˜

ao de nosso trabalho.

Conteúdo

Introduç˜

ao

iii

Lista de Notaç˜

oes

v

1

Quebra de Simetria e o Código Genético

1

1.1

DNA, RNA, S´ıntese de Prote´ınas e o Código Genético . . . . . . . . . . . . .

2

1.2

Simetria e Quebra de Simetria . . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.3

Quebra Imperfeita de Simetria e Congelamento

. . . . . . . . . . . . . . . .

11

2

Grupos Finitos

15

2.1

Estrutura dos Grupos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . .

15

2.2

Grupos de Recobrimento e Representaç˜

oes Projetivas . . . . . . . . . . . . .

19

2.3

Extens˜

oes por Grupos de Automorfismos . . . . . . . . . . . . . . . . . . . .

24

3

Grupos Finitos Simples

29

3.1

Grupos Alternados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

3.2

Grupos Finitos de Tipo Lie

. . . . . . . . . . . . . . . . . . . . . . . . . . .

33

3.3

Grupos Esporádicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

3.4

Classificaç˜

ao dos Grupos Finitos Simples . . . . . . . . . . . . . . . . . . . .

54

i

ii

Conteúdo

4

Representaç˜

oes de Códons

55

4.1

Representaç˜

oes, Caracteres e Extens˜

oes . . . . . . . . . . . . . . . . . . . . .

56

4.2

Grupos Esporádicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

4.3

Grupos Alternados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

4.4

Grupos de Tipo Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

5

Regras de Ramificaç˜

ao

77

5.1

Representaç˜

oes Permutacionais

. . . . . . . . . . . . . . . . . . . . . . . . .

78

5.2

Classes de Conjugaç˜

ao de Subgrupos . . . . . . . . . . . . . . . . . . . . . .

87

5.3

Restriç˜

ao de Caracteres e Ramificaç˜

ao

. . . . . . . . . . . . . . . . . . . . .

94

5.4

Busca por Quebras de Simetria para o Código Genético . . . . . . . . . . . .

97

6

Resultados e Perspectivas

101

6.1

Grupos para o código genético . . . . . . . . . . . . . . . . . . . . . . . . . . 104

A Número de Códigos Genéticos

143

Bibliografia

145

Introduç˜

ao

A origem da vida é, sem dúvida, uma das quest˜

oes mais fascinantes – e também

uma das mais profundas – já levantadas pelo homem. A resposta ainda esta além da nossa

compreens˜

ao mas, ao que tudo indica, só poderá ser alcançada através de uma estreita co-

operaç˜

ao entre as principais áreas do conhecimento envolvidas: f´ısica, qu´ımica, biologia,

geologia, astronomia e até matemática. De fato, entre os vários problemas a serem enfren-

tados na busca por uma resposta, um dos mais importantes refere-se à origem do código

genético, e é neste contexto que a matemática pode fornecer ferramentas e idéias.

É um fato inegável que a área das ciências de maior interaç˜

ao com a matemática é a

f´ısica. Aplicaç˜

oes da matemática em outros setores, além da utilizaç˜

ao de técnicas estat´ısticas

para a análise de dados experimentais, têm menos tradiç˜

ao mas começaram a se intensificar

no decorrer do século 20, principalmente nas áreas de economia e finanças e em ciências

biológicas e da saúde. A t´ıtulo de exemplo, podemos citar os trabalhos de John von Neumann sobre a teoria dos jogos, a teoria do equil´ıbrio de John Nash e a equaç˜

ao de Black & Scholes –

pedras angulares para o desenvolvimento de métodos matemáticos sofisticados em economia

e finanças – ou o modelo de Huxley & Hodgkin para a transmiss˜

ao de impulsos elétricos em

neurônios, que incentivou o uso de equaç˜

oes diferenciais em problemas de biologia. Uma série

de aplicaç˜

oes de métodos matemáticos modernos à biologia pode ser encontrada em [139].

Em 1993, J.E.M. Hornos & Y.M.M. Hornos [80] propuseram um novo modelo para

a evoluç˜

ao do código genético, baseado na hipótese de que o código genético observado

hoje foi o resultado de um processo evolutivo acompanhado de uma sequência de quebras

de simetria. Usando a teoria dos grupos – mais especificamente a teoria dos grupos de Lie compactos conexos ou, equivalentemente, das álgebras de Lie semisimples – para implementar a idéia de quebra de simetria, eles obtiveram uma descriç˜

ao expl´ıcita de uma sequência de

quebras de simetria que pode ter gerado o código genético através de um processo evolutivo.

Além disto, em [80] é sugerida a realizaç˜

ao do mesmo programa usando-se outras noç˜

oes de

simetria, principalmente a teoria dos grupos finitos, ou ainda extens˜

oes da noç˜

ao de simetria,

tais como supersimetria e grupos quânticos.

iii

iv

Introduc

¸˜

ao

O trabalho original de Hornos & Hornos deu impulso à criaç˜

ao de um projeto

temático cujo principal objetivo era a identificaç˜

ao e o estudo de modelos para a evoluç˜

ao

do código genético baseados em métodos algébricos. Nesta direç˜

ao, os principais resultados

do projeto foram: a consolidaç˜

ao e extens˜

ao da classificaç˜

ao já enunciada no trabalho origi-

nal de Hornos & Hornos, com a inclus˜

ao de muitos detalhes n˜

ao apresentados anteriormente

[53, 81, 3] e a implementaç˜

ao do programa de [80] usando o conceito de supersimetria [54, 55].

O presente trabalho, que faz parte deste projeto, apresenta a classificaç˜

ao dos poss´ıveis esque-

mas de quebra de simetria para o código genético no contexto dos grupos finitos e descreve os conceitos e métodos empregados na sua obtenç˜

ao, inclusive uma formulaç˜

ao matemática

compacta e nova da noç˜

ao de congelamento originalmente introduzida por Francis Crick [38].

Um dos principais aspectos de todas as investigaç˜

oes desta natureza é a escolha da

categoria de objetos algébricos em que a análise será realizada. Por exemplo, no trabalho original de Hornos & Hornos, a categoria utilizada é a dos grupos de Lie compactos conexos, amplamente usada na f´ısica, o que conferiu ao trabalho um impacto além da matemática.

No entanto, a escolha mais imediata e natural para um problema de cunho discreto como

este é trabalhar na categoria dos grupos finitos, que possui semelhanças formais com a dos grupos de Lie compactos conexos mas que é menos conhecida. Portanto, para que nosso

trabalho tenha maior impacto, optamos por incluir uma introduç˜

ao, numa linguagem n˜

ao

especializada, à teoria dos grupos finitos simples e à sua classificaç˜

ao, que é um dos mais

célebres resultados da matemática do século 20 e constitui um dos pilares da classificaç˜

ao

aqui apresentada.

Finalmente, gostar´ıamos de mencionar que, como temos um problema concreto em

aos, optamos por uma apresentaç˜

ao também concreta, mas isto n˜

ao significa que os métodos

aqui utilizados sejam espec´ıficos para este problema. Na verdade eles s˜

ao absolutamente ge-

rais e podem ser adaptados facilmente a qualquer tipo de construç˜

ao de modelos baseada nas

idéias de [80] e [53, 81, 3], sendo limitados apenas pela capacidade computacional dispon´ıvel.

Lista de Notaç˜

oes

Z

anel dos números inteiros

Q

corpo dos números racionais

R

corpo dos números reais

C

corpo dos números complexos

×

K

grupo multiplicativo do corpo K

Zn

grupo c´ıclico de ordem n

Alt n

grupo alternado em n s´ımbolos

Sym

grupo simétrico em n s´ımbolos

n

GL(V )

grupo geral linear sobre o espaço vetorial V

Aut(G)

grupo dos automorfismos do grupo G

Inn(G)

grupo dos automorfismos internos do grupo G

Hom(G, H)

conjunto dos homomorfismos do grupo G no grupo H

Z(G)

centro do grupo G

G × H

produto direto dos grupos G e H

v

Cap´ıtulo 1

Quebra de Simetria e o Código

Genético

A noç˜

ao de evoluç˜

ao foi introduzida na biologia por Charles Darwin através do seu

trabalho sobre “A Origem das Espécies” e se tornou um dos mais importantes paradigmas da

ciência moderna, aparecendo sempre quando ocorrem mudanças nas estruturas e padr˜

oes em

que a matéria se autorganiza. Um dos principais aspectos ligados à evoluç˜

ao é o aumento

da complexidade estrutural, no sentido de que estruturas mais simples se agrupam e se

combinam, em vários n´ıveis, formando estruturas cada vez mais sofisticadas e variadas.

Isto resulta na emergência de novas propriedades qualitativas que n˜

ao est˜

ao presentes nos

componentes da estrutura mas só aparecem devido à interaç˜

ao entre eles.

O estudo da formaç˜

ao de padr˜

oes é um dos principais objetivos de diversas disci-

plinas da f´ısica e da matemática, e o conceito de simetria desempenha um papel muito

importante neste tipo de investigaç˜

ao, uma vez que alguma tendência em direç˜

ao à regulari-

dade parece inerente à natureza. O fato de que simetrias podem ser usadas para classificar padr˜

oes de regularidade foi percebido há algum tempo: exemplos clássicos s˜

ao a classificaç˜

ao

das poss´ıveis estruturas cristalinas em 230 classes distintas de simetria ou a classificaç˜

ao de

part´ıculas hadrônicas usando a teoria de representaç˜

oes do grupo SU (3) que levou à des-

coberta de que essas part´ıculas s˜

ao compostas de quarks. Porém, neste tipo de descriç˜

ao

de padr˜

oes, usa-se apenas o “aspecto estático” das simetrias. Existe também um “aspecto

dinâmico” que se revela em contextos t˜

ao distintos como as teorias de calibre, que hoje s˜

ao

a base teórica do modelo padr˜

ao da f´ısica das part´ıculas, ou a teoria de sistemas dinâmicos

e de bifurcaç˜

oes, que se ocupa das transformaç˜

oes entre padr˜

oes. É aqui que se observa o

fenômeno de quebra de simetria, que parece ser um aspecto importante de processos evolu-

tivos. O fenômeno de quebra de simetria ocorre quando um estado inicial com alto grau de

simetria evolve para um estado subsequente com menor grau de simetria. Tal perda de si-

metria pode ser interpretada como resultado da variaç˜

ao de parâmetros externos do sistema;

em outras palavras, bifurcaç˜

oes s˜

ao acompanhadas por quebras de simetria.

1

2

Quebra de Simetria e o Código Genético

A hipótese principal deste trabalho e do projeto temático de pesquisa em que está

inserido é que o fenômeno de quebra de simetria teve um papel importante na evoluç˜

ao do

código genético e que ele pode ser usado para analisar quais foram os passos intermediários e como este processo ocorreu. Aqui, no entanto, trataremos apenas da quest˜

ao da descriç˜

ao

das poss´ıveis configuraç˜

oes de quebra de simetria, dentro de uma certa categoria de simetrias

admiss´ıveis. Neste sentido, nosso trabalho é classificatório, abordando o “aspecto estático”

e n˜

ao o “aspecto dinâmico”; isto é comum em aplicaç˜

oes da teoria dos grupos, como nos

exemplos mencionados acima. Tal trabalho de classificaç˜

ao é imprescind´ıvel para que seja

poss´ıvel abordar, em trabalhos futuros, o “aspecto dinâmico”.

1.1

DNA, RNA, S´ıntese de Prote´ınas e o Código

Genético

Nesta seç˜

ao, recordaremos brevemente a estrutura do DNA e do RNA, do modo como

estes codificam a s´ıntese de prote´ınas e do papel do código genético neste processo. Maiores detalhes podem ser encontrados em livros texto de genética ou bioqu´ımica, por exemplo

[100, 110, 111, 140].

Em todas as formas de vida na Terra, a informaç˜

ao genética é armazenada em dois

pol´ımeros chamados ácido desoxiribonucléico ou DNA e ácido ribonucléico ou RNA,

que s˜

ao constitu´ıdos de

• açucar (desoxiribose e ribose respectivamente),

• fosfato,

• quatro diferentes bases nucléicas:

A (adenina), C (citosina), G (guanina) e

T (timina) no DNA, U (uracila) no RNA.

Quimicamente, citosina, timina e uracila s˜

ao piramidinas, enquanto que adenina e guanina

ao purinas.

O DNA – o material genético primário – forma a famosa hélice dupla, constitu´ıda

de duas fitas de bases nucléicas, orientadas em sentidos opostos. Cada bases nucléica é

quimicamente ligada a uma molécula de desoxiribose e estas s˜

ao interligadas por grupos de

fosfato para formar uma fita. A sequência das bases nucléicas em qualquer uma das duas

fitas determina a outra, pois

• T forma par somente com A e A somente com T (por 2 pontes de hidrogênio),

• C forma par somente com G e G somente com C (por 3 pontes de hidrogênio).

index-21_1.jpg

1.1 DNA, RNA, S´ıntese de Prote´ınas e o Código Genético

3

Estas afirmaç˜

oes s˜

ao conhecidas como as regras de pareamento de Watson-Crick.

Note que matematicamente, elas podem ser vistas como um princ´ıpio de dualidade, que

chamaremos de dualidade de Watson-Crick : toda base nucléica X tem uma base nucléica

dual X†:

A† = T, C† = G, G† = C, T† = A .

Como veremos adiante, a unidade de informaç˜

ao do código genético, chamada de códon,

consiste de uma sequência de três bases: ent˜

ao cada códon XYZ tem um códon dual ou

anticódon canônico

(XYZ)† = Z†Y†X† .

Note a invers˜

ao de ordem que é matematicamente apelativa e corresponde ao fato biológico

de que as duas hélices na molécula de DNA est˜

ao orientadas em sentidos opostos.

Figura 1.1: DNA e a dualidade de Watson-Crick.

4

Quebra de Simetria e o Código Genético

O RNA – o material genético secundário – consiste em somente uma fita de bases,

cada uma quimicamente ligada a uma molécula de ribose e estas s˜

ao interconectadas por

grupos de fosfato. Existem vários tipos de RNA:

• mRNA – RNA mensageiro ou matriz,

• tRNA – RNA de transferência,

• rRNA – RNA ribossômico.

Eles têm funç˜

oes diferentes, mas todos s˜

ao importantes na s´ıntese de prote´ınas.

Como

no RNA a timina é substitu´ıda pela uracila, a dualidade de Watson-Crick para o RNA é

completamente análoga à dualidade para o DNA: basta trocar T por U.

A s´ıntese de prote´ınas nas células procede em basicamente dois estágios:

Transcriç˜

ao: A informaç˜

ao genética é copiada do DNA para o mRNA: a sequência de

bases do mRNA é simplesmente a imagem refletida de uma parte da fita do DNA que

é copiada. O mRNA leva esta informaç˜

ao até os ribossomos.

Traduç˜

ao: No ribossomo (a fábrica de s´ıntese de prote´ınas dentro das células), a sequência

de bases nucléicas é lida do mRNA e traduzida para uma sequência de aminoácidos

que formar˜

ao a prote´ına. O mediador deste processo de traduç˜

ao é o tRNA.

Coloca-se ent˜

ao a quest˜

ao de quais s˜

ao as regras que governam este processo de traduç˜

ao,

da linguagem das bases nucléicas para a linguagem dos aminoácidos.

A primeira quest˜

ao que deve ser respondida refere-se à unidade de informaç˜

ao

genética. É óbvio que esta unidade de informaç˜

ao deve ser composta de pelo menos três

bases nucléicas, uma vez que há apenas 4 bases nucléicas enquanto que as prote´ınas s˜

ao for-

madas usando 20 diferentes aminoácidos. No final da década de 50, Barnett, Brenner, Crick and Watts-Tobin [17] apresentaram um argumento simples que, combinado com informaç˜

oes

experimentais já dispon´ıveis naquela época, permitiu concluir que a soluç˜

ao escolhida pela

natureza é a mais simples: a unidade de informaç˜

ao genética, chamada de códon, é uma

sequência de três bases. Sendo assim uma contagem elementar revela que há exatamente

4 × 4 × 4 = 64 códons.

A segunda e mais concreta quest˜

ao que ent˜

ao se coloca é a seguinte. Qual é o

dicionário usado pela natureza para associar a cada códon um aminoácido ?

1.1 DNA, RNA, S´ıntese de Prote´ınas e o Código Genético

5

Durante a década de 50 houve muita especulaç˜

ao em torno desta quest˜

ao e vários

modelos foram propostos [77]. No entanto a resposta definitiva n˜

ao correspondeu a nenhum

deles; ela foi encontrada experimentalmente [119, 120]. Esta correspondência entre códons (no n´ıvel do mRNA) e aminoácidos é o que se chama o código genético padr˜

ao, resumido

na Tabela 1.1.

primeira

segunda base

terceira

base

U

C

A

G

base

Phe

Ser

Tyr

Cys

U

Phe

Ser

Tyr

Cys

C

U

Leu

Ser

TERM

TERM

A

Leu

Ser

TERM

Trp

G

Leu

Pro

His

Arg

U

Leu

Pro

His

Arg

C

C

Leu

Pro

Gln

Arg

A

Leu

Pro

Gln

Arg

G

Ile

Thr

Asn

Ser

U

Ile

Thr

Asn

Ser

C

A

Ile

Thr

Lys

Arg

A

Met

Thr

Lys

Arg

G

Val

Ala

Asp

Gly

U

Val

Ala

Asp

Gly

C

G

Val

Ala

Glu

Gly

A

Val

Ala

Glu

Gly

G

Tabela 1.1: Código Genético Padr˜

ao para o mRNA.

6

Quebra de Simetria e o Código Genético

Um dos aspectos mais marcantes deste código é a sua degenerescência, isto é, a

presença de códons que s˜

ao sinônimos, representando o mesmo aminoácido. De fato, chama

a atenç˜

ao o agrupamento sistemático dos códons em “multipletos” de códons sinônimos,

sendo que o esquema subjacente tem resistido, durante décadas, às mais variadas tentativas de encontrar uma explicaç˜

ao simples.

Um outro aspecto importante do código genético apresentado na Tabela 1.1 é sua

quase universalidade para os seres vivos do planeta Terra, isto é, o fato de que quase todos os organismos existentes, desde bactérias até células de mam´ıferos, usam o mesmo código

para sintetizar prote´ınas. Definitivamente estabelecido em 1966, ele foi durante mais de uma década chamado o “código genético universal” mas é hoje conhecido como o “código genético padr˜

ao” pois, como foi descoberto em 1979/1980, existem códigos diferentes. No entanto,

os desvios s˜

ao pequenos: em cada caso, a modificaç˜

ao afeta apenas um número pequeno de

atribuiç˜

oes códon-aminoácido e ocorre em classes muito restritas de espécies ou, com maior

frequência, em certas organelas tais como mitocôndria e cloroplastos – estruturas intra-

celulares que possuem seu próprio DNA e exercem funç˜

oes biológicas altamente espec´ıficas

(a produç˜

ao de ATP no caso das mitocôndria e a fotoss´ıntese no caso dos cloroplastos).

O argumento normalmente empregado por biólogos e geneticistas para explicar a

quase universalidade do código genético padr˜

ao foi formulado pela primeira vez por Crick,

através da sua famosa hipótese do “acidente de congelamento”. De acordo com esta hipótese, o código genético, depois de passar por uma fase primordial de evoluç˜

ao, foi congelado na sua

forma observada hoje, quando o mecanismo de s´ıntese de prote´ınas nos organismos havia

se tornado t˜

ao complexo que qualquer outra modificaç˜

ao seria letal; universalidade ent˜

ao

seria uma consequência do fato de que este congelamento tenha acontecido muito cedo na

evoluç˜

ao, antes mesmo da bifurcaç˜

ao das formas de vida em diferentes reinos. Até os desvios

encontrados posteriormente reforçam este argumento, pois as variaç˜

oes s˜

ao observadas, na

sua grande maioria, em situaç˜

oes onde a press˜

ao evolutiva no sentido de manutenç˜

ao do

código padr˜

ao está reduzida.

Por outro lado, a simples afirmaç˜

ao de que a evoluç˜

ao do código genético foi congelada

em algum estágio n˜

ao fornece nenhuma indicaç˜

ao sobre quais foram as leis que regeram

esta evoluç˜

ao antes do congelamento. Na sua forma extrema, a hipótese do “acidente de

congelamento” postula que a evoluç˜

ao primordial foi inteiramente uma quest˜

ao de acaso

Um simples argumento combinatório mostra, no entanto, que o número de poss´ıveis códigos

genéticos é da ordem de 1099, sendo que a esmagadora maioria n˜

ao exibe nenhum tipo de

regularidade. (Veja Apêndice A.) Portanto, deste ponto de vista, o surgimento de um código genético com regularidade marcante é extremamente improvável.

A abordagem algébrica ao problema da evoluç˜

ao do código genético trata exatamente

esta quest˜

ao. Baseia-se na idéia de que as degenerescências observadas no código genético

ao reflexo de uma simetria primordial que foi quebrada no curso de sua evoluç˜

ao, em uma

index-25_1.jpg

1.2 Simetria e Quebra de Simetria

7

sequência de passos. Uma das principais vantagens desta abordagem é que a imposiç˜

ao

de compatibilidade com alguma simetria reduz drasticamente o número de possibilidades

mencionado anteriormente, levando a uma probabilidade n˜

ao-desprez´ıvel para que o código

genético seja justamente como ele é hoje. Neste sentido, a abordagem algébrica é compat´ıvel com uma idéia de congelamento mais brando.

1.2

Simetria e Quebra de Simetria

De forma intuitiva, o uso de simetrias é um fenômeno cultural muito antigo:

observam-se princ´ıpios de simetria subjacentes à construç˜

ao das pirâmides do Egito e in-

dependentemente da civilizaç˜

ao Maia, na arquitetura dos templos gregos, na ornamentaç˜

ao

árabe, etc.. Aparentemente, a presença de simetrias está ligada ao nosso senso estético1.

Observa-se também que muitas vezes, as simetrias observadas na natureza n˜

ao s˜

ao exatas,

mas s˜

ao quebradas. Geralmente, uma simetria quebrada manifesta-se de forma aproximada,

isto é, ocorre um desvio da simetria exata que no entanto é suficientemente pequeno para que ela ainda possa ser claramente percebida. Um exemplo t´ıpico é a simetria quiral que tem

um papel igualmente importante em f´ısica, qu´ımica e biologia e que aparece sempre quando os objetos considerados admitem duas formas distintas de configuraç˜

ao espacial – a levógena

e a destrógena. Em termos matemáticos esta simetria corresponde à troca de orientaç˜

ao

no espaço e sua quebra indica a possibilidade de que as formas levógenas e destrógenas se comportam de maneiras distintas.

Figura 1.2: Vaso de madeira exibindo simetria ornamental (Kuba, Zaire).

1Uma bela apresentaç˜ao destas idéias encontra-se no livro clássico “Symmetry” de Hermann Weyl [155].

8

Quebra de Simetria e o Código Genético

A formalizaç˜

ao da noç˜

ao de simetria em linguagem matemática moderna foi iniciada

com a definiç˜

ao do conceito de grupo devido a Evariste Galois (grupos discretos) e Sophus

Lie (grupos cont´ınuos). Do ponto de vista abstrato, o estudo da teoria dos grupos consiste em obter suas propriedades a partir dos axiomas que os definem, enquanto que do ponto de

vista concreto grupos s˜

ao realizados através de transformaç˜

oes em algum conjunto ou espaço

(em muitos casos se consideram várias realizaç˜

oes ao mesmo tempo). O verdadeiro poder da

teoria de grupos surge quando se combinam estes dois pontos de vista. É esta combinaç˜

ao

que usaremos para formular os conceitos intuitivos de simetria e quebra de simetria em

termos matemáticos precisos.

Uma simetria exata é descrita abstratamente por um grupo G e, no contexto da

teoria das representaç˜

oes lineares adotado neste trabalho, é realizada concretamente por um

conjunto de matrizes que formam uma representaç˜

ao de G em um espaço vetorial de dimens˜

ao

finita V , escolhido de acordo com a aplicaç˜

ao que se tem em mente. O espaço vetorial V

representa o objeto que possui a simetria descrita pelo grupos G. A situaç˜

ao mais simples

ocorre quando esta representaç˜

ao é irredut´

ıvel : isto significa, na terminologia usada em

outras áreas da ciência diferentes da matemática (tais como f´ısica ou qu´ımica), que o espaço vetorial V é um multipleto sob G. Mais geralmente, assumiremos que toda representaç˜

ao

considerada é completamente redut´

ıvel, o que significa que ela pode ser decomposta na

soma direta de subrepresentaç˜

oes irredut´ıveis que formam um conjunto de multipletos

sob G. O invariante mais importante de um multipleto é a sua dimens˜

ao (como espaço

vetorial) e por isso, usa-se frequentemente a seguinte terminologia para efatizar a dimens˜

ao

dos multipletos: um multipleto de dimens˜

ao um é chamado singleto, um multipleto de

dimens˜

ao dois é chamado dubleto, um multipleto de dimens˜

ao três é chamado tripleto,

um multipleto de dimens˜

ao quatro é chamado quadrupleto, etc..

Uma simetria quebrada é descrita fixando, além do mais, um subgrupo H de G

que representa a simetria residual, i.e., aquela parte da simetria que permanece intacta

durante a quebra. Ent˜

ao uma representaç˜

ao irredut´ıvel de G, quando restrita a H, se quebra

em várias representaç˜

oes irredut´ıveis de H, isto é, um único multipleto sob G se quebra

em vários multipletos sob H – um fenômeno comumente chamado de ramificaç˜

ao. Mais

geralmente, a idéia de que a quebra de simetria frequentemente ocorre em vários estágios, e n˜

ao de uma única vez, pode ser implementada supondo que G vem junto com uma sequência

de subgrupos G1, . . . , Gk que formam uma cadeia descendente

G ⊃ G1 ⊃ . . . ⊃ Gk ,

levando a uma sequência de ramificaç˜

oes sucessivas onde, em cada passo, uma representaç˜

ao

irredut´ıvel do grupo anterior se quebra em várias representaç˜

oes irredut´ıveis do próximo

grupo da cadeia.

1.2 Simetria e Quebra de Simetria

9

Finalmente, pode-se perguntar sobre o problema inverso, que é o seguinte. Dado

apenas um conjunto de multipletos, encontrar um grupo G e uma cadeia descendente de

subgrupos G1, . . . , Gk tal que o conjunto dado de multipletos pode ser arranjado em uma representaç˜

ao irredut´ıvel de G e reproduzido por ramificaç˜

ao através da cadeia de subgrupos

G1, . . . , Gk. Tal “abordagem espectroscópica” é a maneira como se identificam simetrias na teoria quântica.

No caso do código genético, é exatamente esta situaç˜

ao que encontramos, pois o

código genético fornece uma distribuiç˜

ao de multipletos da seguinte forma. Definimos o

espaço dos códons como sendo o espaço vetorial complexo V que tem como base o

conjunto dos códons apresentados na Tabela 1.1. O agrupamento dos códons em códons

sinônimos induz naturlamente uma decomposiç˜

ao de V em soma direta de subespaços: dois

códons pertencem ao mesmo subespaço se e somente se representam o mesmo aminoácido.

Agora queremos encontrar um grupo juntamente com uma cadeia descendente de subgrupos

que forneça essa distribuiç˜

ao de multipletos através do processo de ramificaç˜

ao que expli-

camos acima. Este processo representaria ent˜

ao um histórico parcial da evoluç˜

ao do código

genético, através de quebras de simetrias.

Para resolver este problema precisamos antes de mais nada escolher uma metodologia

que torne o problema tratável. O primeiro passo é restringir a classe de grupos dentro da qual procuraremos um candidato para o grupo que representará a simetria primordial.

O problema foi tratado pela primeira vez com sucesso por Hornos & Hornos [80]

no contexto dos grupos de Lie compactos conexos. Esta classe de grupos foi escolhida por

vários motivos, sendo o principal que as representaç˜

oes de dimens˜

ao finita dos grupos de

Lie compactos conexos s˜

ao todas completamente redut´ıveis. Como os grupos finitos têm a

mesma propriedade, é natural estudar o problema nesta categoria, como já foi proposto em

[80]. A estratégia geral para a análise das degenerescências no código genético é a seguinte: (i) Encontrar, dentre todos os grupos finitos, aqueles que possuem representaç˜

oes irre-

dut´ıveis de dimens˜

ao 64, chamadas representaç˜

oes de códons.

(ii) Para cada possibilidade obtida, analizar todos os subgrupos e tentar encontrar pelo menos um subgrupo que reproduz a distribuiç˜

ao de multipletos do código genético,

isto é, que decomp˜

oe uma representaç˜

ao de códons em

• 3 sextupletos,

• 5 quadrupletos,

• 2 tripletos,

• 9 dubletos,

• 2 singletos.

10

Quebra de Simetria e o Código Genético

O grupo inicial G, em conjunto com sua representaç˜

ao de códons, representa a “simetria

exata primordial” do modelo escolhido.

Nesta fase, o código genético é completamente

degenerado, isto é, todos os códons têm o mesmo significado e portanto ainda n˜

ao codificam

nenhum amonoácido. Com a primeira quebra de simetria surge o primeiro código genético,

também chamado de “código genético primitivo”, que já codifica alguns aminoácidos, mas

que ainda n˜

ao atingiu a forma final e portanto está sujeito a sofrer uma nova quebra de

simetria e incorporar outros aminoácidos ao seu repertório. A hipótese de que a representaç˜

ao

de códons seja irredut´ıvel reflete o caráter “primitivo” da simetria primordial, pois uma representaç˜

ao redut´ıvel é um objeto composto: podendo ser expressa como uma soma direta

de representaç˜

oes irredut´ıveis, ela corresponde a um estágio posterior do processo e n˜

ao

ao estágio inicial. Um argumento semelhante pode ser aplicado ao próprio grupo inicial:

suporemos que ele também seja “primitivo”, no sentido de que n˜

ao pode ser constru´ıdo a

partir de outros grupos. Isto nos leva à categoria dos grupos finitos simples – os “blocos fundamentais” da teoria dos grupos finitos. Ressaltamos que essa condiç˜

ao é imposta apenas

sobre o grupo inicial; os subgrupos utilizados na quebra de simetria podem ser arbitrários.

Aqui é que surge a principal diferença entre a categoria dos grupos finitos e a dos

grupos de Lie compactos conexos, que abreviaremos por grupos lcc. Na categoria dos grupos lcc, os subgrupos têm uma estrutura relativamente simples: s˜

ao (a menos de um recobrimento

finito) o produto direto de um toro (grupo lcc abeliano) e um grupo lcc semisimples, que por sua vez é (a menos de um recobrimento finito) o produto direto de um número finito de grupos lcc simples [23, 32]. Como as representaç˜

oes irredut´ıveis de um toro s˜

ao unidimensionais [23],

estes podem ser ignorados, e portanto basta considerar grupos lcc semisimples. A teoria das representaç˜

oes dos grupos lcc semisimples pode ser descrita inteiramente em termos da teoria

das representaç˜

oes das álgebras de Lie semisimples complexas; assim toda a análise pode ser

executada neste âmbito, isto é, na categoria das álgebras de Lie semisimples complexas e suas subalgebras semisimples. As subalgebras semisimples de uma álgebra semisimples qualquer

podem ser constru´ıdas de maneira uniforme graças aos teoremas de Dynkin [47, 48]. Estes

resultados classificam as subalgebras semisimples maximais de uma álgebra de Lie simples e por processo iterativo pode-se obter todas as subalgebras semisimples. A outra vantagem de se trabalhar com álgebras de Lie semisimples é que a teoria de representaç˜

oes destes objetos,

criada por Élie Cartan e Hermann Weyl, vem com todas as ferramentas necessárias, que s˜

ao

as seguintes:

(i) Classificaç˜

ao das representaç˜

oes irredut´ıveis de todas as álgebras de Lie semisimples

e fórmulas de dimens˜

ao [20, 56, 62, 82, 101, 147] que permitem determinar todas as

álgebras de Lie semisimples que possuem representaç˜

oes de códons.

(ii) Tabelas das regras de ramificaç˜

ao, que descrevem como se decomp˜

oem as representaç˜

oes

irredut´ıveis de uma álgebra de Lie semisimples sob restriç˜

ao às suas subalgebras semi-

simples [117].

1.3 Quebra Imperfeita de Simetria e Congelamento

11

No caso dos grupos finitos simples a situaç˜

ao é bem diferente, pois como já comen-

tamos esta categoria n˜

ao é fechada com relaç˜

ao a subgrupos e n˜

ao existem até hoje métodos

para se construir todos os subgrupos de maneira uniforme, como no caso das álgebras de Lie semisimples. Existe apenas uma classificaç˜

ao dos subgrupos maximais [99] dos grupos fini-

tos simples, com a exceç˜

ao do grupo Monstro [121], mas isto n˜

ao é suficiente para construir

todos os subgrupos. A classificaç˜

ao das representaç˜

oes irredut´ıveis dos grupos finitos simples

também n˜

ao é completamente conhecida, pois ao contrário das álgebras de Lie semisimples

para as quais existe uma teoria geral de representaç˜

oes em termos de pesos máximos, so-

mente certas fam´ılias de grupos finitos simples têm suas tabelas de caracteres completamente calculadas e os métodos s˜

ao em geral completamente diferentes dependendo de cada fam´ılia.

Por outro lado, grupos finitos podem ser abordados por métodos computacionais

para resolver todos estes problemas. A teoria computacional dos grupos finitos está bastante avançada e conta com poderosos algoritmos [57] que tornam esta análise fact´ıvel na categoria dos grupos finitos simples.

1.3

Quebra Imperfeita de Simetria e Congelamento

Quando um fenômeno admite simetrias, em geral, os modelos usados para o es-

tudo deste fenômeno s˜

ao idealizados: sup˜

oe-se que a simetria seja perfeita, mesmo quando

é somente aproximada. Porém existem argumentos que suportam a relevância de tal apro-

ximaç˜

ao: previs˜

oes baseadas em modelos com simetria aproximada diferem qualitativamente

das previs˜

oes baseadas em modelos sem simetria alguma. Isso pode ser comprovado, por

exemplo, em sistemas dinâmicos com uma simetria perturbada por pequenas imperfeiç˜

oes

ou efeitos estocásticos, através de simulaç˜

oes numéricas.

O mesmo pode-se dizer de um processo de quebra de simetria, que também pode

sofrer perturbaç˜

oes ou flutuaç˜

oes, de forma que a simetria residual n˜

ao é perfeita. De fato,

todos os modelos já obtidos para o código genético, incluindo o original de Hornos & Hornos [80], n˜

ao possuem um simetria residual perfeita.

Este tipo de imperfeiç˜

ao pode ser incorporado no esquema através de uma pequena

generalizaç˜

ao da definiç˜

ao de quebra de simetria. Considere uma cadeia de subgrupos

G ⊃ G1 ⊃ . . . ⊃ Gk−1 ⊃ Gk ,

que produz decomposiç˜

oes do espaço vetorial V em subespaços irredut´ıveis sob cada um

dos subgrupos Gi, i = 1, . . . , k. Na caso de uma quebra perfeita de simetria, a distribuiç˜

ao

final de multipletos só depende do último subgrupo da cadeia, Gk (a menos de conjugaç˜

ao).

A generalizaç˜

ao descrita a seguir implica que a distribuiç˜

ao final de multipletos depende dos

últimos dois subgrupos da cadeia, Gk−1 e Gk (a menos de conjugaç˜

ao).

12

Quebra de Simetria e o Código Genético

Para formular as regras que governam este processo de quebra imperfeita, lembremos

primeiro que, em geral, a decomposiç˜

ao de uma representaç˜

ao completamente redut´ıvel de

um grupo G em um espaço vetorial V em soma direta de subespaços irredut´ıveis n˜

ao é única.

No entanto, para cada subespaço irredut´ıvel W de V , podemos definir ˆ

W como a soma direta

de todos os subespaços irredut´ıveis de V que s˜

ao equivalentes a W sob a aç˜

ao de G. Dizemos

que ˆ

W é a componente isot´

ıpica de V correspondente a W . A utilidade deste conceito

decorre do fato de que a decomposiç˜

ao de V em componentes isot´ıpicas é única, enquanto

que a decomposiç˜

ao de cada componente isot´ıpica em subespaços irredut´ıveis n˜

ao é. Mais

explicitamente, podemos escolher subespaços irredut´ıveis Wi de V (i = 1, . . . , n), tais que todo subespaço irredut´ıvel de V é equivalente a exatamente um deles; ent˜

ao

V =

ˆ

W1 ⊕ . . . ⊕ ˆ

Wn .

Esta decomposiç˜

ao é chamada de decomposiç˜

ao isot´

ıpica de V [60]. O número de sub-

espaços irredut´ıveis em cada componente isot´ıpica ˆ

Wi é chamada de multiplicidade de ˆ

Wi.

Agora fixemos um par de subgrupos G1, G2 de G sujeitos às seguintes condiç˜

oes:

G ⊃ G1 ⊃ G2

e

G2 é maximal em G1 .

A restriç˜

ao da representaç˜

ao irredut´ıvel de G em V ao subgrupo G1 produz uma de-

composiç˜

ao de V em subespaços V 1 (i = 1, . . . , r) irredut´ıveis sob G

i

1, enquanto que a

restriç˜

ao da representaç˜

ao irredut´ıvel de G em V ao subgrupo G2 produz uma decom-

posiç˜

ao de V em subespaços V 2 (j = 1, . . . , s) irredut´ıveis sob G

j