Uso de heurísticas para a aceleração do aprendizado por reforço

Uso de heurísticas para a aceleração do aprendizado por reforço
Escola Politécnica / Sistemas Digitais Universidade de São Paulo "Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o...
Esta é apenas uma pré-visualização em PDF das primeiras páginas do Uso de heurísticas para a aceleração do aprendizado por reforço. Baixe a versão completa para ler o livro completo.
Nota: Você deve ter o Adobe Reader ou o Acrobat Installed para ver esta visualização
Você não tem o Adobe Reader instalado. Para ver esse arquivo, baixe Adobe Reader em <a href="http://get.adobe.com/reader/" target="_blank">aquí</a>. Ou, se quiser baixar o PDF para seu computador, clique <a href="https://portugues.free-ebooks.net/ebook/Uso-de-heuristicas-para-a-aceleracao-do-aprendizado-por-reforco/pdf">aqui</a>.