Uso de heurísticas para a aceleração do aprendizado por reforço

Escola Politécnica / Sistemas Digitais
Universidade de São Paulo
"Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o...
Esta é apenas uma pré-visualização em PDF das primeiras páginas do Uso de heurísticas para a aceleração do aprendizado por reforço.
Baixe a versão completa para ler o livro completo.
Nota: Você deve ter o Adobe Reader ou o Acrobat Installed para ver esta visualização
Nota: Você deve ter o Adobe Reader ou o Acrobat Installed para ver esta visualização