Seleção e análise dos modelos PARAFAC e Tucker e gráfico triplot com aplicação em interação tripla por Lúcio Borges de Araújo - Versão HTML

ATENÇÃO: Esta é apenas uma visualização em HTML e alguns elementos como links e números de página podem estar incorretos.
Faça o download do livro em PDF, ePub, Kindle para obter uma versão completa.

Universidade de S˜

ao Paulo

Escola Superior de Agricultura “Luiz de Queiroz”

Seleç˜

ao e análise dos modelos PARAFAC e Tucker e gráfico triplot

com aplicaç˜

ao em interaç˜

ao tripla

Lúcio Borges de Araújo

Tese apresentada para obtenç˜ao do t´ıtulo de Doutor em

Agronomia.

Área de concentraç˜ao: Estat´ıstica e Experi-

mentaç˜ao Agronômica

Piracicaba

2009

Lúcio Borges de Araújo

Licenciado em Matemática

Seleç˜

ao e análise dos modelos PARAFAC e Tucker e gráfico triplot com

aplicaç˜

ao em interaç˜

ao tripla

Orientador:

Prof. Dr. CARLOS TADEU DOS SANTOS DIAS

Tese apresentada para obtenç˜ao do t´ıtulo de Doutor em

Agronomia. Área de concentraç˜ao: Estat´ıstica e Experimentaç˜ao

Agronômica

Piracicaba

2009

Dados Internacionais de Catalogação na Publicação

DIVISÃO DE BIBLIOTECA E DOCUMENTAÇÃO - ESALQ/USP

Araújo, Lúcio Borges de

Seleção e análise dos modelos PARAFAC e Tucker e gráfico triplot com aplicação em

interação tripla / Lúcio Borges de Araújo. - - Piracicaba, 2009.

111p. : il.

Tese (Doutorado) - - Escola Superior de Agricultura “Luiz de Queiroz”, 2009.

Bibliografia.

1. Análise de dados 2. Correlação genética e ambiental 3. Fenótipos 4. Genética

estatística I. Título

CDD 519.5

A663s

“Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor”

3

DEDICAT ÓRIA

Sabemos que Deus age em todas as coisas para o bem daqueles que o amam,

dos que foram chamados de acordo com o seu propósito. ”(Romanos 8:28)

Que diremos, pois, diante dessas coisas? Se Deus é por nós, quem será contra nós?

Aquele que n˜ao poupou seu próprio Filho, mas o entregou por todos nós,

como n˜ao nós dará justamente com ele, e de graça, todas as coisas? ”(Romanos 8:31,32)

Mas em todas estas coisas somos mais que vencedores,

por meio daquele que nos amou ”(Romanos 8:37)

A minha querida amiga, companheira e principalmente esposa

Mirian Fernandes Carvalho Araújo,

por toda ajuda, companheirismo, amizade, apoio, incentivo e o amor sempre constante.

Te amo muito!

Aos meus pais Lu´ıs Guilherme de Araújo e Tânia Maria Borges Araújo,

por todas oportunidades concedidas.

Aos meus irm˜aos Gabriel, Aurélia e Evaldo,

pela amizade e incentivo.

4

AGRADECIMENTOS

A Deus, autor e consumador da minha fé, por sua eterna fidelidade e sem o

qual nada podemos fazer.

Ao professor Dr. Carlos Tadeu dos Santos Dias pela orientaç˜ao cultivada pela

amizade, apoio e ajuda à elaboraç˜ao deste trabalho. A sua esposa Elvina e seus filhos Vitor

e Laura, pelos momentos prazerosos passados juntos.

Ao Professor Mario Varela, pelas dicas, sugest˜oes e correç˜oes na fase final do

trabalho

A ESALQ/USP pela estrutura f´ısica e humana dispon´ıvel.

A CNPq pela concess˜ao de bolsas de estudos.

Aos amigos e irm˜aos em Cristo da Igreja Evangélica na Paulista pela amizade

e apoio sempre presente em todos os momentos.

Ao professores do programa de Pós-graduaç˜ao em Estat´ıstica e Experimentaç˜ao

Agronômica Dr. César Gonçalves de Lima, Dra. Clarice Garcia Borges Demétrio, Dr. Décio

Barbin, Dr. Edwin Ortega, Dra. Roseli Aparecida Leandro, Dr. S´ılvio Zocchi, Dra. Sônia

Maria De Stefano Piedade, Dr. Vitor Ozaki, pelos cuidados na formaç˜ao.

Aos funcionários do Departamento de Ciências Exatas da ESALQ/USP,

Solange de Assis Paes Sabadin e Eduardo Bonilha, pelos aux´ılios permanentes, em espe-

cial a Luciane Braj˜ao pela amizade e ajuda sempre que preciso.

Aos amigos do Departamento de Bioestat´ıstica da UNESP/BOTUCATU.

Aos ex-professores e atuais colegas de departamento da UFU, em especial ao

prof. Ednaldo Carvalho Guimar˜aes e ao prof. Marcelo Tavares.

Aos grandes amigos: Osmar Jesus Macedo, pela alegria de sua companhia e

colaboraç˜ao em tantos momentos, e César Augusto Taconeli, pelos grandes momentos de

alegria em Botucatu.

Aos colegas de turma: Ana Alice, Angela, Édila, Vanderly e Wilson e a todos

os outros colegas do mestrado e doutorado, em especial, ao Marcelino “Popó” pelo compa-

nheirismo de longa data.

A todos que cooperaram direta ou indiretamente na realizaç˜ao deste trabalho,

muito obrigado.

5

SUM ÁRIO

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1 INTRODUC

¸ ˜

AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2 REVIS ˜

AO DE LITERATURA . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

2.1 Interaç˜ao Genótipos × Locais × Anos . . . . . . . . . . . . . . . . . . . . . . . .

15

2.1.1 Graus de interaç˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

2.1.2 Avaliaç˜ao da Interaç˜ao Genótipos × Ambientes . . . . . . . . . . . . . . . . . .

16

2.1.3 Modelos de ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.1.4 Fatores Genótipo, Local, Tempo . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.2 O que é análise multiway? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

2.2.1 Linhas, Colunas e Tubos; Fatia Fontal, Vertical e Horizontal . . . . . . . . . . .

23

2.2.2 História dos modelos de análise multiway . . . . . . . . . . . . . . . . . . . . . .

23

2.2.3 Modelos de componentes com três entradas (PARAFAC) . . . . . . . . . . . . .

25

2.2.4 Modelos de Tucker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.2.4.1

Modelos Tucker3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

2.2.4.1.1

Propriedades do modelo Tucker3 . . . . . . . . . . . . . . . . . . . . . . .

31

2.2.4.2

Modelos de Tucker2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.2.4.3

Modelos de Tucker1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

2.2.5 Relaç˜oes entre modelos de componentes de três entradas . . . . . . . . . . . . .

34

2.2.5.1

Hierarquia dos Modelos PARAFAC e TUCKER3 . . . . . . . . . . . . . . .

35

2.2.5.2

Hierarquia dos Modelos TUCKER3, TUCKER2 e TUCKER1 . . . . . . . .

36

2.3 Graus de liberdade dos modelos multiway . . . . . . . . . . . . . . . . . . . . . . .

37

2.4 Postos de arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.5 Determinaç˜ao da dimensionalidade de um modelo de Tucker . . . . . . . . . . . .

39

2.5.1 Procedimento Dif F it de Timmerman-Kiers . . . . . . . . . . . . . . . . . . . .

39

2.5.2 Análise residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

2.5.3 Critério st de Ceulemans-Kiers . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

6

2.6 Determinaç˜ao da dimensionalidade de um modelo PARAFAC . . . . . . . . . . .

42

2.6.1 Procedimentos de dividir ao meio ( Split-half) . . . . . . . . . . . . . . . . . . . .

43

2.6.2 Consistência do núcleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.7 Estabilidade do modelo e poder preditivo por validaç˜ao . . . . . . . . . . . . . . .

44

2.8 Biplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

2.8.1 Decomposiç˜ao em Valores Singulares . . . . . . . . . . . . . . . . . . . . . . . .

46

2.8.2 Biplot padr˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

2.9 Joint plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

3 MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

3.1 Caracter´ısticas dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

3.2 Análise de dados considerando duas entradas . . . . . . . . . . . . . . . . . . . . .

53

3.2.1 Análise de variância conjunta de duas entradas . . . . . . . . . . . . . . . . . .

53

3.2.2 Análises AMMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

3.3 Estimaç˜ao dos parâmetros dos modelos multiway . . . . . . . . . . . . . . . . . .

57

3.3.1 Algoritmo para o modelo PARAFAC . . . . . . . . . . . . . . . . . . . . . . . .

58

3.3.2 Estimativas iniciais para Algoritmo MQA do modelo PARAFAC . . . . . . . . .

59

3.3.3 Algoritmo para o modelo Tucker3 . . . . . . . . . . . . . . . . . . . . . . . . . .

60

3.3.4 Estimativas iniciais para o Algoritmo MQA do modelo Tucker3 . . . . . . . . .

62

3.4 Proposta para o triplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

3.4.1 Produto de elementos por elementos de matrizes . . . . . . . . . . . . . . . . . .

62

3.4.2 Arranjo de três entradas em um gráfico de duas dimens˜oes . . . . . . . . . . . .

63

3.4.3 O produto dos elementos das matrizes A, B e C e suas propriedades . . . . . .

64

3.5 Visualizando o triplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

3.5.1 Comparaç˜ao visual dos elementos de uma linha, coluna ou tubo do arranjo . . .

68

3.6 Relaç˜oes entre linhas, entre colunas e entre tubos . . . . . . . . . . . . . . . . . .

69

3.7 Análise triplot de dados de três entradas . . . . . . . . . . . . . . . . . . . . . . .

70

3.8 Análise de dados considerando três entradas . . . . . . . . . . . . . . . . . . . . .

71

3.8.1 Análise de variância conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

3.8.2 Generalizaç˜ao da Análises AMMI para o caso de três fatores usando o modelo

PARAFAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73

7

3.9 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

4 RESULTADOS E DISCUSS ˜

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

4.1 Análise de variância conjunta com dois fatores . . . . . . . . . . . . . . . . . . . .

77

4.2 Análise AMMI e Biplot para dados de duas entradas . . . . . . . . . . . . . . . .

78

4.3 Análise de variância conjunta com três fatores . . . . . . . . . . . . . . . . . . . .

83

4.4 Modelos de três entradas para a interaç˜ao tripla . . . . . . . . . . . . . . . . . . .

84

4.4.1 Ajuste do Modelo de Tucker3 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

4.4.2 Ajuste do Modelo PARAFAC . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

4.5 Triplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

4.6 Comentários Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

5 CONCLUS ˜

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

100

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

102

ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

107

8

RESUMO

Seleç˜

ao e análise dos modelos PARAFAC e Tucker e gráfico triplot com

aplicaç˜

ao em interaç˜

ao tripla

O presente trabalho tem os seguintes objetivos: propor uma sistemática para o

estudo e a interpretaç˜ao da estabilidade e adaptabilidade fenot´ıpica, através de duas técnicas

de análise multiway (PARAFAC e Tucker3); propor a construç˜ao de um gráfico, denominado

de Triplot, que possibilita avaliar as relaç˜oes entre os 3 modos (genótipos, locais e anos); im-

plementar uma rotina computacional para a análise de dados, segundo os modelos multiway;

implementar uma rotina computacional para a construç˜ao do Triplot. Os dados a serem uti-

lizados s˜ao relativos a experimentos com 13 genótipos de feij˜ao que foram conduzidos em 9 ex-

perimentos distintos constitu´ıdos pelos anos agr´ıcolas de 2000/2001, 2001/2002 e 2005/2006,

pelos munic´ıpios de Dourados e Aquidauana, sendo que os experimentos foram instalados na

época das águas (Dourados)e também na época da seca (Dourados e Aquidauana). Cada

local é constitu´ıdo de munic´ıpio e uma época de instalaç˜ao. Os resultados indicaram que o

gráfico triplot e joint plot, facilitam o entendimento da interaç˜ao tripla e traz ao pesquisador

informaç˜oes mais reais sobre a interaç˜ao tripla, do que a modelagem AMMI de duas entradas;

o gráfico triplot, ajuda a identificar genótipos, locais e anos estáveis, dentro de um grande

grupo de genótipos, locais e anos; de uma maneira geral recomenda-se, utilizar o triplot e

o joint plot juntos, para obter melhores interpretaç˜oes dos resultados; dentre os genótipos

estudados, o genótipo 6 é o que menos contribui para a interaç˜ao e o os genótipos 12, 9 e 5

s˜ao os que mais contribuem para a interaç˜ao.

Palavras-chaves: Interaç˜ao genótipos × ambientes × anos; Modelo PARAFAC; Modelo

Tucker3; Triplot; Estabilidade; Adaptabilidade

9

ABSTRACT

Selection and analysis of the PARAFAC and Tucker models and triplot graphic

with application in triple interaction

The present work has the following objectives: to propose a systematics for the

study and the interpretation of the phenotypic stability and adaptability, through several

multiway models (PARAFAC and Tucker3); to propose a graphic, called of Triplot, that it

makes possible to evaluate the relations between the 3 ways (genotypes, locations and years);

to implement a computational routine for the data analysis, according multiway models;

to implement a computational routine for the construction of Triplot. The used data are

relative the experiments with 13 genotypes of beans that had been lead in 9 experimental

distinct ones constituted by agricultural years of 2000/2001, 2001/2002 and 2005/2006, by

Dourados and Aquidauana cities, where the experiments had been installed at the time of

waters (Dourados) and also at the time of dries (Dourados and Aquidauana). Each location

is constituted of city and time of installation. The results indicated that the graphic triplot

and joint plot, facilitate the agreement of triple interaction and bring to the researcher more

real information about triple interaction, of what AMMI model of two way; the graphic

triplot, helps to identify stabels genotypes, locations and years, inside of a great group of

genotypes, location and years; in a general recommend to use triplot and joint plot together,

to get better interpretations of the results; the genotype 6 is what less contributes for the

triple interaction and genotypes 12, 9 and 5 are the that more contribute for the interaction.

Keywords: Genotypes × locations × years interaction; PARAFAC model; Tucker3 model;

Triplot; Stability; Adaptability

10

LISTA DE FIGURAS

Figura 1 - Particionando um arranjo de três entradas em fatias (arranjos de duas en-

tradas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

Figura 2 - Decomposiç˜ao de um arranjo de três entradas propostas por Harshman

(1970) e Carrol e Chang (1970) . . . . . . . . . . . . . . . . . . . . . . . .

25

Figura 3 - O modelo PARAFAC com R components . . . . . . . . . . . . . . . . . .

27

Figura 4 - Representaç˜ao gráfica do modelo Tucker3 . . . . . . . . . . . . . . . . . .

30

Figura 5 - Representaç˜ao gráfica do modelo Tucker2 . . . . . . . . . . . . . . . . . .

33

Figura 6 - Representaç˜ao gráfica do modelo Tucker1, em que somente o primeiro modo

é reduzido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

Figura 7 - Modelo PARAFAC escrito como um modelo de Tucker3 . . . . . . . . . .

35

Figura 8 - Representaç˜ao de dois marcadores de objetos e um marcador de variáveis

em um biplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

48

Figura 9 - Um triplot que apresenta as matrizes A, B, C. Os elementos de A, B, C

s˜ao multiplicados segundo o produto de Hadamard para produzir o arranjo Z 65

Figura 10 - Os marcadores das linhas, colunas, tubos e combinaç˜ao de uma coluna com

um tubo do arranjo Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

Figura 11 - Biplot para os dados de produç˜ao de feij˜ao (ton/ha), com 13 genótipos e 9

ambientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

82

Figura 12 - Joint plot projetado dentro da primeira componente do terceiro modo . .

89

Figura 13 - Joint plot projetado dentro da segunda componente do terceiro modo . . .

90

Figura 14 - Scree plot do número de componentes no modelo PARAFAC e a porcenta-

gem da soma de quadrados explicada pelo modelo . . . . . . . . . . . . .

93

Figura 15 - Triplot para os dados de produç˜ao de feij˜ao (ton/ha) . . . . . . . . . . . .

95

Figura 16 - Triplot combinando os escores do locais e anos para avaliar a adaptabilidade

dos genótipos às combinaç˜oes de locais e anos. . . . . . . . . . . . . . . .

96

11

LISTA DE TABELAS

Tabela 1 - Caracterizaç˜ao dos ambientes experimentais . . . . . . . . . . . . . . . . .

52

Tabela 2 - Esquema da análise de variância para experimentos de um mesmo grupo de

g genótipos avaliado em e locais com b blocos . . . . . . . . . . . . . . . .

54

Tabela 3 - As matrizes A, B e C para gerar Z . . . . . . . . . . . . . . . . . . . . .

64

Tabela 4 - Elementos do arranjo Z matrizado combinado as colunas tubos . . . . . .

64

Tabela 5 - Esquema da análise de variância para experimentos de um mesmo grupo de

genótipos avaliados em l locais e a anos com b blocos . . . . . . . . . . . .

73

Tabela 6 - Análise de variância conjunta para um conjunto de dados com 13 genótipos

avaliados em 9 ambientes com 3 blocos . . . . . . . . . . . . . . . . . . . .

77

Tabela 7 - Médias dos genótipos, ambientes e posiç˜ao das médias em relaç˜ao a produ-

tividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

78

Tabela 8 - Valores estimados da interaç˜ao dupla de 13 genótipos e 9 ambientes (com-

binaç˜ao de 3 locais e 3 anos) para a produç˜ao em ton/ha . . . . . . . . . .

79

Tabela 9 - Teste Fr de Cornelius para determinar o número de termos significativos

para a interaç˜ao G × E . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

Tabela 10 -Análise de variância conjunta para um conjunto de dados com 13 genótipos

avaliados em 3 locais, 3 anos com 3 blocos . . . . . . . . . . . . . . . . . .

83

Tabela 11 -Efeitos da interaç˜ao tripla para cada combinaç˜ao de genótipos, locais e anos 84

Tabela 12 -Resultado do procedimento de Timmerman-Kiers para selecionar o modelo

de Tucker3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

Tabela 13 -Escores dos componentes principais para um modelo de Tucker3 (3,2,2) para

o arranjo da interaç˜ao tripla entre genótipos × locais × anos . . . . . . .

88

Tabela 14 -Número de componentes utilizado no modelo PARAFAC e a porcentagem

da soma de quadrados da interaç˜ao tripla explicada pelo modelo . . . . .

92

Tabela 15 -Primeiro e segundo escores dos componentes principais para genótipos ( a 1

e a 2), locais ( b 1 e b 2) e anos ( c 1 e c 2) para os dados do exemplo. . . . . .

94

12

1

INTRODUC

¸ ˜

AO

Os experimentos multi-ambientais (MET) s˜ao conduzidos através de vários

anos para os principais produtos agr´ıcolas no mundo, constituindo um passo caro mas essen-

cial para a liberaç˜ao de um novo genótipo de um produto agr´ıcola e, conseqüentemente,

a recomendaç˜ao de cultivar. Os METs s˜ao essenciais porque a presença da interaç˜ao en-

tre genótipos e ambientes (GE), ou seja, a mudança na performance relativa de genótipos

através de diferentes ambientes, complica a avaliaç˜ao de cultivar. Quando n˜ao existe a in-

teraç˜ao GE, um único cultivar prevaleceria no mundo inteiro e um único experimento bastaria

para avaliaç˜ao de cultivar (Gauch e Zobel, 1996). A interaç˜ao GE constitui o principal desafio

na melhora de cultivares, e a análise de dados provenientes de experimentos multi-ambientais

constitui um aspecto importante para o melhoramento genético de plantas. Por isso, mel-

horias nos métodos usados para análise de dados deve ser de interesse à comunidade de

melhoristas.

O objetivo primário de um MET é identificar cultivares superiores. A prática

mais comum usada para este fim é comparar o rendimento de um genótipo em vários am-

bientes de teste (normalmente combinaç˜oes de locais e anos). A validez desta prática é

baseada normalmente em suposiç˜oes n˜ao declaradas de que os ambientes dos experimentos

multi-ambientais pertencem a um único mega-ambiente, que é definido como um grupo de

locais no qual um mesmo conjunto de cultivares apresenta-se melhor por vários anos. Nor-

malmente, n˜ao se afirma isso, mas a avaliaç˜ao de cultivar sempre é espec´ıfica para separar

mega-ambientes. Se os ambientes de teste forem suficientemente heterogêneos, os cultivares

que s˜ao selecionados baseado em rendimento podem n˜ao ser o melhor em alguns dos ambi-

entes de teste e, em casos extremos, podem n˜ao estar entre os melhores em quaisquer dos

ambientes. Assim, a segunda utilidade de análise de dados multi-ambientais, antes de fazer

a avaliaç˜ao de cultivares, deveria ser investigar as relaç˜oes entre os ambientes de teste e a

possibilidade de diferenciaç˜ao do mega-ambiente (YAN; HUNT, 2002).

Para a descriç˜ao da resposta média de genótipos em ambientes e para o estudo e

interpretaç˜ao da interaç˜ao genótipos × ambientes (GE) em METs de experimentos agr´ıcolas,

13

duas classes de modelos s˜ao comumente utilizadas: modelos lineares e modelos lineares-

bilineares. A princ´ıpio, as abordagens para a análise da interaç˜ao GE incluem a apresentaç˜ao

dos dados em tabela de duas entradas (matriz), sendo que cada casela desta tabela contém

a resposta média de cada genótipo em cada ambiente.

Considere agora o caso em que os METs s˜ao avaliados através de vários anos

( ou seja, genótipos × locais × anos) (GLA), em que os dados podem ser organizados em

arranjo de três entradas que, neste caso, cada entrada se refere a genótipos, locais e anos.

Em alguns casos o investigador pode estar interessado em saber se existe uma

estrutura comum encoberta pelos locais com relaç˜ao aos anos e como os vários genótipos

respondem através da estrutura formada por ambientes e anos. Alguns genótipos podem

responder com altas respostas em alguns locais, mas n˜ao em outros e, alguns locais podem

estar mais associados com alguns genótipos do que a outros por alguns anos. Um procedi-

mento para ganhar uma compreens˜ao clara em arranjo GLA de três-entradas é determinar

uma estrutura dimensional menor, expressado em componentes principais, para a interaç˜ao

genótipos × locais × anos e ent˜ao estudar as relaç˜oes entre estes componentes. Esta apro-

ximaç˜ao é mais útil que combinar dois dos três fatores de maneira que os dados formem um

arranjo de duas entradas. Outro procedimento menos útil é excluir um fator diretamente

(por exemplo anos) e analisar um arranjo de duas entradas dos genótipos × locais em cada

ano e, neste caso, o problema está em encontrar uma interpretaç˜ao global para os anos.

Para os dados organizados em arranjo de três-entradas existem alguns modelos

para analisá-los, como por exemplo, os modelos propostos por Tucker: Tucker1, Tucker2 e

Tucker3 e o modelo proposto por Harshman que é denominado de modelo PARAFAC, que

fornecem uma decomposiç˜ao trilinear dos dados organizados no arranjo.

Na maioria dos estudos, devido a falta de uma ferramenta adequada para estu-

dar a interaç˜ao entre genótipos, locais e anos, os pesquisadores combinam os fatores locais e

anos. Mas de acordo com Varela et. al.(2006), em alguns casos, esta combinaç˜ao leva a uma

perda de informaç˜ao quando se ajusta um modelo de duas entradas (por exemplo, os mo-

delos AMMI) e quando se faz a estimaç˜ao dos efeitos da interaç˜ao. Ent˜ao, faz-se necessário

desenvolver ferramentas que permitam o desdobramento e a interpretaç˜ao da interaç˜ao tripla

através dos modelos Tucker3 e PARAFAC.

14

Assim, o presente trabalho tem os seguintes objetivos: propor uma sistemática

para o estudo e a interpretaç˜ao da estabilidade e adaptabilidade fenot´ıpica, através de duas

técnicas de análise multiway; propor a construç˜ao de um gráfico, denominado de Triplot,

que possibilita avaliar as relaç˜oes entre os três modos (genótipos, ambientes e anos); imple-

mentar uma rotina computacional para a análise de dados, segundo os modelos multiway;

implementar uma rotina computacional para a construç˜ao do Triplot.

15

2

REVIS ˜

AO DE LITERATURA

2.1

Interaç˜

ao Genótipos × Locais × Anos

Os genótipos analisados em um experimento s˜ao avaliados sob uma grande

variedade de condiç˜oes. Eles s˜ao expostos a diferentes tipos de solos, n´ıveis de fertilidade,

temperaturas e práticas culturais, sendo que estas caracter´ısticas s˜ao encontradas em uma

lavoura e podem ser descritas como um ambiente (DAS, 2005).

Quando os genótipos s˜ao comparados em diferentes ambientes, suas perfor-

mances relativas em outros ambientes podem n˜ao ser as mesmas. Um genótipo pode ter alta

produç˜ao em um ambiente e um segundo genótipo pode ser superior em outros ambientes.

Mudança na performance relativa de genótipos através de diferentes ambientes é referida

como interaç˜ao genótipos × ambientes (G × E).

2.1.1

Graus de interaç˜

ao

Todo fator que é parte da planta tem um potencial para causar diferentes

performances que é associado com a interaç˜ao genótipos × ambientes. Variáveis ambientais

podem ser classificadas como fatores previs´ıveis e n˜ao previs´ıveis (ALLARD; BRADSHAW,

1964). Fatores previs´ıveis s˜ao aqueles que ocorrem de maneira sistemática ou ocorre sob

controle humano, tais como tipos de solo, data de plantio, espaçamento de linhas, quantidades

de nutrientes, profundidade de semeadura etc. Fatores n˜ao previs´ıveis s˜ao aqueles que variam

de maneira n˜ao sistemática, incluindo chuva, temperatura, umidade relativa etc.

Os fatores previs´ıveis podem ser avaliados individualmente e coletivamente de

acordo com suas interaç˜oes com genótipos (ALLARD; BRADSHAW, 1964). Estudos têm

sido feitos para estudar as seguintes interaç˜oes: genótipos × tipos de solo, genótipos ×

espaçamentos entre linhas, genótipos × datas de semeadura etc.

Fatores n˜ao previs´ıveis contribuem para a interaç˜ao entre os genótipos, locais

e anos. As interaç˜oes genótipos × locais (G × L), genótipos × anos (G × A) e genótipos ×

locais × anos (G × L × A) têm sido avaliadas para diversos genótipos (DAS, 2005).

A performance relativa dos genótipos através dos ambientes, determina a im-

portância de estudar e interpretar uma interaç˜ao. N˜ao existe interaç˜ao genótipos × ambientes

16

quando a performance relativa entre genótipos n˜ao muda através de ambientes (CHAVES,

2001).

2.1.2

Avaliaç˜

ao da Interaç˜

ao Genótipos × Ambientes

Fazer uma avaliaç˜ao da importância da interaç˜ao genótipos × ambientes re-

quer procedimentos experimentais apropriados. Assim, a compreens˜ao dos passos envolvidos

no delineamento, conduç˜ao, análise e interpretaç˜ao de tal experimento pode ser útil nesta

avaliaç˜ao.

Os genótipos escolhidos para uma avaliaç˜ao de uma poss´ıvel interaç˜ao é uma

importante consideraç˜ao no delineamento do experimento. Algumas análises da interaç˜ao

genótipos × ambientes n˜ao s˜ao baseadas em um experimento especificamente delineado para

tal proposta, particularmente a avaliaç˜ao da interaç˜ao com locais e anos. Ao invés disso,

os pesquisadores utilizam dados de genótipos e linhas experimentais que foram avaliados

através de locais e anos como parte de um programa com outra finalidade. A principal

desvantagem deste procedimento é que os genótipos e experimentos podem n˜ao ser uma

amostra aleatória de genótipos avaliados. A estimativa da interaç˜ao genótipos × ambientes

obtida com genótipos selecionados pode ser mais alta ou mais baixa do que o valor obtido

com indiv´ıduos aleatórios. Mas é prefer´ıvel usar uma amostra aleatória dos genótipos que

est˜ao dispon´ıveis para teste, pois neste caso a quantidade de objetivos do estudo é maior do

que considerar os genótipos fixos (ANNICHIARICO, 2002).

Um teste deve ser conduzido em dois ou mais locais e anos para obter estima-

tivas dos efeitos das interaç˜oes G × L, G × A, G × L × A. Os locais de teste s˜ao geralmente aqueles rotineiramente utilizados pelos pesquisadores. Os locais podem ser considerados como

efeito fixos quando eles n˜ao s˜ao aleatoriamente escolhidos de todos poss´ıveis locais na área.

Alguns pesquisadores consideram locais como um efeito aleatório, pois os pesquisadores n˜ao

tem controle sobre as condiç˜oes climáticas que v˜ao ocorrer nos locais em qualquer ano. Pela

mesma raz˜ao, anos s˜ao considerados como efeitos aleatórios.

Pelo menos duas repetiç˜oes s˜ao necessárias em cada local e em cada ano para

obter uma estimativa do erro experimental com o qual testa-se a significância da interaç˜ao

de interesse. Qualquer repetiç˜ao adicional vai fornecer uma estimativa mais realista do erro

17

experimental.

A interpretaç˜ao dos dados inclui considerar as significâncias estat´ısticas de cada

fonte de variaç˜ao e fazer uma avaliaç˜ao da importância prática da variaç˜ao observada entre

os valores médios. A interaç˜ao G × L mede a consistência da performance entre genótipos em

diferentes locais. A consistência do desempenho dos genótipos em diferentes anos é indicada

pela interaç˜ao G × A. A interaç˜ao G × L × A avalia a consistência entre genótipos para cada

combinaç˜ao de ano e locais. Um experimento conduzido em dois locais em dois anos tem 4

combinaç˜oes entre locais × anos: local 1 × ano 1; local 1 × ano 2; local 2 × ano 1; e local 2 × ano 2. A significância da interaç˜ao G × L × A indica que a performance relativa entre

genótipos n˜ao foi a mesma em cada combinaç˜ao de anos e locais. Para todas as interaç˜oes

mencionadas anteriormente, um exame dos valores médios é necessário para determinar se

uma interaç˜ao significativa é devido a mudanças na classificaç˜ao entre genótipos ou a mu-

danças nas diferenças entre os genótipos mas, sem ocorrer uma variaç˜ao na classificaç˜ao.

A falta de qualquer interaç˜ao estatisticamente significativa que envolva

genótipos, simplifica os testes requeridos pelo programa de melhoramento para desenvolver e

selecionar genótipos. Teoricamente, esta falta de significância da interaç˜ao de genótipos com

locais, anos ou com a combinaç˜ao locais e anos, indica que um teste em local durante um ano

poderia ser suficiente para identificar genótipos com potencial genético superior. Genótipo

com a melhor performance em determinado local e ano poderia também ser superior a outros

locais e anos.

As implicaç˜oes práticas de uma interaç˜ao G × E estatisticamente significante

depende das causas da interaç˜ao. Interaç˜oes G × E n˜ao s˜ao problemas para os pesquisadores,

se estas n˜ao s˜ao devidas as mudanças na classificaç˜ao de performance entre os genótipos.

Sob estas circunstâncias, um teste em um local determina que certo ano poderia ser usado

para identificar os genótipos superiores. O mesmo genótipo poderia ser superior em todos

locais e anos, embora as magnitudes de superioridade variassem. Interaç˜oes G × E signifi-

cantes, que envolvem mudanças na classificaç˜ao da performance entre genótipos, s˜ao comuns

e para determinar a interpretaç˜ao prática das interaç˜oes, os pesquisadores deveriam consid-

erar a extens˜ao das mudanças na classificaç˜ao e seus impactos no melhoramento genético.

Julgamentos subjetivos, devem ser feitos e, além disso, outros pesquisadores devem avaliar

18

o mesmo conjunto de dados para verificar se as formas de agir s˜ao as mesmas ou n˜ao. As

opç˜oes dispon´ıveis para os pesquisadores s˜ao diferentes para cada tipo de interaç˜ao (DAS,

2005):

i) G × L: Amplas flutuaç˜oes nas posiç˜oes de performance dos genótipos nos locais su-

gerem que pode ser desejável desenvolver genótipos para diferentes locais por meio de

programas e teste de seleç˜ao independentes. A perda ao estabelecer programas indepen-

dentes para diferentes áreas geográficas é substancial, por essa raz˜ao, a decis˜ao pode ser

dif´ıcil. Antes de estabelecer programas de melhoramento independentes, o pesquisador

poderia determinar a interaç˜ao G × L. Se as diferenças entre os locais s˜ao devido ao

tipo de solo ou a outros fatores que s˜ao consistentes de ano para ano, programas de

melhoramento independentes podem ser mais apropriados. Diferenças temporais entre

locais associadas com condiç˜oes climáticas n˜ao usuais n˜ao podem justificar programas

independentes.

ii) G × A: Uma ordenaç˜ao inconsistente entre os genótipos cultivados em diferentes anos

é, em algumas situaç˜oes, mais dif´ıcil de tratar que uma interaç˜ao G × L. Um pesquisador

n˜ao deve pensar na opç˜ao de estabelecer programas de melhoramento independentes

para diferentes anos. Uma opç˜ao primária dispon´ıvel é identificar os genótipos que

apresentaram uma performance superior através dos anos. Isto envolve os genótipos

em vários anos antes da seleç˜ao para lançar um genótipo como uma cultivar. Para

reduzir o tempo gasto com a melhoria genética, múltiplos locais em um ano, s˜ao usados

como substituto para os anos. A substituiç˜ao é efetiva somente quando as divergências

nas condiç˜oes climáticas entre os locais s˜ao comparáveis às diferenças entre os anos.

iii) G × L × A: Quando existem modificaç˜oes nas posiç˜oes dos genótipos associados com

a combinaç˜ao individual de uma interaç˜ao local × ano, o pesquisador deve identificar

genótipos com performances médias superiores sobre os locais e anos. Por exemplo, uma

análise da interaç˜ao genótipos × ambientes para a produç˜ao de tabaco na Carolina do

Norte indicou que as interaç˜oes G × A e G × L n˜ao foram significantes (JONES;

MATZINGER; COLLINS, 1960), a classificaç˜ao (posiç˜oes relativas) entre os genótipos

foram similares quando avaliados sobre os locais e as posiç˜oes relativas dos cultivares

19

também foram similares quando avaliados sobre os anos. Mas a interaç˜ao G × L ×

A foi significativa no experimento. A interaç˜ao parece estar associada à condiç˜ao de

combinaç˜ao espec´ıfica, tais como padr˜ao de chuva e infestaç˜ao de doença, que provocou

uma variaç˜ao na classificaç˜ao dos genótipos entre certas combinaç˜oes de locais × anos.

Se um genótipo com uma alta performance média sobre os anos, é escolhido, espera-se

que este genótipo tenha uma performance satisfatória no próximo ano, mas este pode

n˜ao ser o melhor naquela particular época.

2.1.3

Modelos de ANOVA

Considere um experimento fatorial com três fatores: genótipos, locais e anos.

Suponha ainda que cada um de “g” genótipos foi avaliado em “l” locais e em “a” anos.

Com o objetivo de analisar os dados, análises de variâncias (ANOVAs) preliminares para

experimentos individuais podem ser levadas em conta para avaliar a variaç˜ao entre ambientes

pelo erro experimental e, possivelmente, variância genot´ıpica. ANOVA conjunta para um

grupo de experimentos ou seus subconjuntos podem ser executadas com objetivos diferentes,

como:

i) verificar a ocorrência de efeitos diferentes (isto é, significância das fontes de variaç˜ao);

ii) estimar e comparar médias para n´ıveis de fatores fixos (em particular, média dos

genótipos através de regi˜oes ou dentro de sub-regi˜oes);

iii) estimar os componentes de variância genot´ıpicos e genótipo-ambiental.

A ANOVA também pode representar um passo na análise de adaptaç˜ao ou na

avaliaç˜ao de medidas de estabilidade do rendimento.

2.1.4

Fatores Genótipo, Local, Tempo

Além dos fatores de genótipo e poss´ıvel de bloco, a ANOVA conjunta pode

incluir o fator local e/ou também um fator de tempo, como ano (colheitas anuais) ou ciclo de

colheita, por exemplo, culturas perenes. Alternativamente, poderia haver um fator ambiental,

para o qual os n´ıveis s˜ao representados através de experimentos individuais. Alguns modelos

20

de ANOVA também podem incluir um fator de sub-regi˜ao (seguindo a definiç˜ao de mega-

ambientes) e/ou um fator de grupo de germoplasma que pode coincidir com acúmulo de genes

distintos, variedades ou material com padr˜oes de adaptaç˜ao contrastantes.

Os modelos de ANOVA podem diferir em termos do número e tipo de fatores,

como também a relaç˜ao entre fatores. Em particular, o fator ano pode ser cruzado, ou ani-

nhado dentro do fator local. Um elemento adicional de distinç˜ao entre modelos surge da

definiç˜ao de cada fator como aleatório ou fixo. Em geral, aleatoriedade implica que aqueles

n´ıveis de fatores s˜ao aleatoriamente escolhidos de uma populaç˜ao, para a qual as conclus˜oes

para fatores fixos s˜ao estendidas, sendo que a extens˜ao de variaç˜ao é de preocupaç˜ao primária.

Esta definiç˜ao pode ser aplicada ao fator tempo. O fator de genótipo pode ser definido como

aleatório ou fixo, dependendo do objetivo da análise, isto é, quando o objetivo for apoiar

decis˜oes relativas a elementos de uma estratégia de melhoramento estimando: componentes

de variância, parâmetros genéticos, ganhos genéticos esperados de diferentes estratégias de

adaptaç˜ao ou procedimentos de seleç˜ao, etc. Neste caso, os genótipos deveriam ser represen-

tativos da base genética, consequentemente o efeito do fator genótipo é aleatório. Reciproca-

mente, genótipo é um fator fixo quando a ênfase estiver na comparaç˜ao de material testado

para seleç˜ao ou recomendaç˜ao (ANNICHIARICO, 2002).

O fator de local definitivamente é aleatório quando o interesse principal da

análise está na estimaç˜ao de componentes de variância (WRICKE; WEBER, 1986) para

locais que s˜ao representativos de uma populaç˜ao relevante dentro da regi˜ao designada. A es-

colha entre aleatório e fixo pode ser problemática para locais próximos que s˜ao investigados

por semelhança do efeito da interaç˜ao de G × L e da poss´ıvel identificaç˜ao de sub-regi˜oes

relativamente uniforme por pesquisadores ou por propostas de recomendaç˜ao, sendo que o

efeito aleatório normalmente é o mais apropriado. O local pode ser considerado fixo somente

se cada local representar uma área bem definida com manejo da safra relativa, ent˜ao re-

sultados para um determinado local podem ser estendidos para a área que representa. O

fator de ambiente é normalmente aleatório. Finalmente, os grupos de fatores sub-regi˜oes e o

germoplasma, se presentes, s˜ao considerados fixos.

Três grupos principais de modelos de ANOVA parcialmente hierárquicos s˜ao

considerados para a análise de conjuntos dos experimentos dispostos em um delineamento

21

em blocos aleatorizados (ANNICHIARICO, 2002). O primeiro grupo inclui modelos com três

fatores: genótipo; local ou ambiente; e bloco dentro de locais ou ambientes.

A resposta observada Yijr do i-ésimo genótipo no j-ésimo local e r-ésimo bloco

é:

Yijr = µ + gi + lj + br( lj) + ( gl) ij + εijr

(1)

em que:

µ: é uma constante comum a todos os efeitos, normalmente a média geral;

gi: é o efeito do i-ésimo genótipo, com i = 1 , 2 , ..., g;

lj: é o efeito do j-ésimo local, com j = 1 , 2 , ..., l;

( gl) ij: é o efeito da interaç˜ao do i-ésimo genótipo com o j-ésimo local;

br( lj): é o efeito do r-ésimo bloco dentro do j-ésimo local, com r = 1 , 2 , ..., b; εijr: é o erro experimental associado ao i-ésimo genótipo, no j-ésimo ambiente e no

r-ésimo bloco assumido ser independente e εijr ∼ N(0 , σ 2).

Este modelo é útil para análise de adaptaç˜ao baseado em experimentos que n˜ao est˜ao repeti-

dos no tempo, como freqüentemente é o caso para os genótipos de culturas perenes.

O segundo grupo de modelos de ANOVA inclui quatro fatores: genótipo, local,

ano (ou outro fator de tempo) cruzado com o fator local e bloco dentro de locais dentro de

anos.

A resposta Yijkr do genótipo i no local j, ano k e bloco r é:

Yijkr = µ + gi + lj + ak + br( lj( ak)) + ( gl) ij + ( ga) ik + ( la) jk + ( gla) ijk + εijrk (2)

em que:

µ: é uma constante comum a todos os efeitos, normalmente a média geral;

gi: é o efeito do i-ésimo genótipo, com i = 1 , 2 , ..., g;

lj: é o efeito do j-ésimo local, com j = 1 , 2 , ..., l;

22

ak: é o efeito do k-ésimo ano, com k = 1 , 2 , ..., a.

br( lj( ak)): é o efeito do r-ésimo bloco dentro do k-ésimo ano dentro do j-ésimo local, com r = 1 , 2 , ..., b;

( gl) ij: é o efeito da interaç˜ao do i-ésimo genótipo com o j-ésimo local;

( ga) ik: é o efeito da interaç˜ao do i-ésimo genótipo com o k-ésimo ano;

( la) jk: é o efeito da interaç˜ao do j-ésimo local com o k-ésimo ano;

( gla) ijk: é o efeito da interaç˜ao do i-ésimo genótipo com o j-ésimo local com o k-ésimo ano;

εijrk: é o erro experimental associado ao i-ésimo genótipo, no j-ésimo ambiente, no

k-ésimo ano e no r-ésimo bloco assumido ser independente e εijrk ∼ N(0 , σ 2).

O terceiro grupo de modelos inclui os mesmos fatores do segundo grupo, mas

o fator tempo é aninhado em local. A resposta de Yijkr é:

Yijkr = µ + gi + lj + ak( lj) + br( lj( ak)) + ( gl) ij + ( ga) ik( lj) + εijrk (3)

em que:

µ: é uma constante comum a todos os efeitos, normalmente a média geral;

gi: é o efeito do i-ésimo genótipo, com i = 1 , 2 , ..., g;

lj: é o efeito do j-ésimo local, com j = 1 , 2 , ..., l;

ak( lj): é o efeito do k-ésimo ano dentro do j-ésimo local, com k = 1 , 2 , ..., a.

br( lj( ak)): é o efeito do r-ésimo bloco dentro do k-ésimo ano dentro do j-ésimo local, com r = 1 , 2 , ..., b;

( gl) ij: é o efeito da interaç˜ao do i-ésimo genótipo com o j-ésimo local;

( ga) ik( lj): é o efeito da interaç˜ao do i-ésimo genótipo com o k-ésimo ano dentro do j-ésimo local;

23

εijrk: é o erro experimental associado ao i-ésimo genótipo, no j-ésimo ambiente, no

k-ésimo ano e no r-ésimo bloco assumido ser independente e εijrk ∼ N(0 , σ 2).

Esse tipo de ANOVA é particularmente útil quando locais diferem ao longo

dos anos, embora também possa ser usado como uma alternativa ao procedimento exposto

anteriormente, isto é, para testar anos através dos locais.

2.2

O que é análise multiway ?

Análises multiway é a análise de dados que envolve vários fatores. Suponha um

experimento no qual foram analisados “g” genótipos em “l” locais, assim os resultados podem

ser organizados em uma tabela de duas entradas (ou matriz) de dimens˜ao g × l. Tomando

a” dessas medidas, por exemplo em “a” anos diferentes, os dados podem ser organizados

em um arranjo cúbico de dimens˜oes g × l × a.

2.2.1

Linhas, Colunas e Tubos; Fatia Fontal, Vertical e Horizontal

Para os arranjos de duas entradas é usual fazer uma distinç˜ao entre as partes es-

peciais do arranjo, como linhas e colunas. Esta distinç˜ao também é feita para arranjos de três

entradas e uma divis˜ao adequada é: fatias frontais, horizontais e verticais. Existem três tipos

diferentes de fatiar um arranjo de três dimens˜oes X ( I × J × K), em que “ ” indica que X é

um arranjo com 3 entradas. O primeiro tipo origina as fatias horizontais X 1 , X 2 , . . . , XI,

todas de dimens˜oes ( J × K). O segundo origina as fatias verticais X 1 , X 2 , . . . , XJ, todas tem dimens˜oes ( I × K). E o último tipo origina as fatias frontais X 1 , X 2 , . . . , XK, em que todas tem dimens˜oes ( I × J). Esta notaç˜ao é conveniente, mas nem sempre clara, por

exemplo, n˜ao é conhecido se X 2 é a segunda fatia frontal, vertical ou horizontal. Para evitar

esta ambigüidade, pode-se usar, por exemplo, Xi=2 para a primeira entrada. A Figura 1,

ilustra esses casos

2.2.2

História dos modelos de análise multiway

A maioria dos trabalhos de análises multiway s˜ao provenientes da psicometria

(registro e medida da atividade intelectual). Os trabalhos pioneiros apareceram na metade

index-25_1.png

24

Figura 1 - Particionando um arranjo de três entradas em fatias (arranjos de duas entradas)

século XX e terminaram próximo de 1980, quando os modelos mais importantes e seus algo-

ritmo foram introduzidos.

Algumas das primeiras idéias em análises multiway foram publicadas por Cat-

tell (1944, 1952). O princ´ıpio da parcimônia de Thurstone (1935) diz que uma estrutura sim-

ples pode ser encontrada para descrever uma matriz de dados ou uma matriz de correlaç˜oes,

com a ajuda de fatores. Para a análise simultânea de várias matrizes, Cattell (1944) propôs

o uso do princ´ıpio do perfil paralelo proporcional. O princ´ıpio do perfil paralelo proporcional

diz que um conjunto comum de fatores pode ser encontrado e que pode ser ajustado com

diferentes dimens˜oes ponderadas para vários dados matriciais no mesmo momento. Isto é o

mesmo que encontrar um conjunto comum de fatores para um amontoado de matrizes, ou

seja, um arranjo de três entradas.

De acordo com Smilde et. al. (2004) o artigo mais importante de Cattell

é o trabalho de 1952, no qual o autor define arranjo multiway. Ele definiu objetos, cir-

custâncias/tempo, atributo, escala e observador como as cinco entradas para um arranjo

multiway idealizado e por raz˜oes práticas, reduziu-as a um arranjo de três entradas com

pessoas, atributos e circunstâncias.

A decomposiç˜ao de um arranjo de três entradas foi apresentado primeiramente

por Tucker (1963, 1964, 1966). Essa decomposiç˜ao consiste em encontrar matrizes de cargas

A, B e C e um arranjo núcleo G de três entradas, que foram introduzidos com um exemplo

hipotético de 12 indiv´ıduos, 9 tratamentos e 5 observadores. Em outro trabalho independente

25

foi mostrado uma similaridade entre o arranjo núcleo do modelo de Tucker e a matriz de

autovalores na decomposiç˜ao em valor singular (LEVIN, 1965).

Outros modelos de três entradas foram introduzidos independentemente por

Carroll e Chang (1970), que chamaram seu modelo de CANDECOMP ( Canonical Decompo-

sition) e Harshman (1970) que usou o nome de PARAFAC ( Parallel Factor Analysis). En-

tretanto, a idéia de modelagem que está por trás destes dois modelos é a mesma. A proposta

básica deste modelo é usar o mesmo fator para descrever a variaç˜ao em diversas matrizes

simultaneamente, embora com diferentes ponderaç˜oes para cada matriz. Isto é exatamente

a idéia definida no perfil paralelo proporcional proposta por Cattell (1944).

O modelo PARAFAC com três entradas consiste em determinar matrizes de

cargas A, B e C com o mesmo número de fatores (Figura 2). Este modelo usualmente

produz eixos de coordenadas únicos (n˜ao existe liberdade para rotacionar a orientaç˜ao dos

vetores de cargas), enquanto que um modelo de Tucker fornece subespaços únicos.

M componentes

M componentes