skip to main content
Visitante
Meu Espaço
Minha Conta
Sair
Identificação
This feature requires javascript
Tags
Revistas Eletrônicas (eJournals)
Livros Eletrônicos (eBooks)
Bases de Dados
Bibliotecas USP
Ajuda
Ajuda
Idioma:
Inglês
Espanhol
Português
This feature required javascript
This feature requires javascript
Primo Search
Busca Geral
Busca Geral
Acervo Físico
Acervo Físico
Produção Intelectual da USP
Produção USP
Search For:
Clear Search Box
Search in:
Acervo Físico
Or hit Enter to replace search target
Or select another collection:
Search in:
Acervo Físico
Busca Avançada
Busca por Índices
This feature requires javascript
This feature requires javascript
Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio
Renê Pegoraro Anna Helena Reali Costa 1960-
2001
Localização:
EPBC - Esc. Politécnica-Bib Central
(FT-1599 )
e outros locais
(Acessar)
This feature requires javascript
Localização & Reservas
Detalhes
Resenhas & Tags
Solicitações
Mais Opções
Prateleira Virtual
This feature requires javascript
Enviar para
Adicionar ao Meu Espaço
Remover do Meu Espaço
E-mail (máximo 30 registros por vez)
Imprimir
Link permanente
Referência
EasyBib
EndNote
RefWorks
del.icio.us
Exportar RIS
Exportar BibTeX
This feature requires javascript
Título:
Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio
Autor:
Renê Pegoraro
Anna Helena Reali Costa 1960-
Assuntos:
ROBÓTICA
;
ALGORITMOS E ESTRUTURAS DE DADOS
Notas:
Tese (Doutorado)
Notas Locais:
Sistemas Digitais
Descrição:
Diversos algoritmos de Aprendizado por Reforço (AR) foram propostos para solucionar os Processos de Decisão de Markov. Em AR, a prendizagem é conduzida através de repetidas interações do agente com o ambiente, por tentativa e erro. Encontrar políticas ótimas usando os algoritmos de AR pode ser bastante demorado. Visando acelerar a aprendizagem, muitos algoritmos foram desenvolvidos. Um destes algoritmos é o QS-Learning, no qual uma única experiência pode atualizar mais do que um valor da ação, através do uso de uma função de espalhamento. Com o intuito de melhorar o algoritmo QS, considera-se o uso de similaridades entre pares estado-ação, definidos em um espaço de similaridades, e a aplicação destas similaridades para acelerar alguns algoritmos AR. Esta Tese propõe o algoritmo QSx-Learning, que é o algoritmo QS-Learning com identificação explícita de similaridades entre pares estado-ação, e o algoritmo Minimax-QSx, o qual combina o algoritmo Minimax-Q com o algoritmo QSx-Learning. Diversas simulações foram desenvolvidas no domínio de robótica móvel, incluindo o futebol de robôs, que é um domínio multiagentes. Pode-se observar que, definindo funções de espalhamento muito simples, dependentes do domínio, consegue-se melhorias significativas no desempenho dos algoritmos de aprendizado por reforço
Data de criação/publicação:
2001
Formato:
110 p.
Idioma:
Português
Links
Este item no Dedalus
This feature requires javascript
This feature requires javascript
Voltar para lista de resultados
Anterior
Resultado
5
Avançar
This feature requires javascript
This feature requires javascript
Buscando em bases de dados remotas. Favor aguardar.
Buscando por
em
scope:(USP_FISICO)
Mostrar o que foi encontrado até o momento
This feature requires javascript
This feature requires javascript