Result Number | Material Type | Add to My Shelf Action | Record Details and Options |
---|---|---|---|
1 |
Material Type: Dissertação de Mestrado
|
Model-based policy gradients: an empirical study on linear quadratic environmentsLovatto, Ângelo GregórioBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2022-06-17Acesso online. A biblioteca também possui exemplares impressos. |
|
2 |
Material Type: Livro
|
Reinforcement learning state-of-the-artMarco Wiering; Martijn van OtterloHeidelberg Springer New York c2012Localização: IME - Inst. Matemática e Estatística (QA860.C3 W648r )(Acessar) |
|
3 |
Material Type: Dissertação de Mestrado
|
Reinforcement learning applied to vessel navigation in fast-time simulations.Andrade, José Amendola NettoBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica 2020-10-02Acesso online |
|
4 |
Material Type: Tese de Doutorado
|
Knowledge reuse for deep reinforcement learning.Glatt, RubenBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica 2019-06-12Acesso online. A biblioteca também possui exemplares impressos. |
|
5 |
Material Type: Livro
|
Reinforcement learning an introductionRichard S. Sutton Andrew G BartoCambridge, Mass. MIT Press c1998Localização: EESC - Esc. Engenharia de São Carlos (001.535 S967r ) e outros locais(Acessar) |
|
6 |
Material Type: Tese de Doutorado
|
Uso de heurísticas para a aceleração do aprendizado por reforço.Bianchi, Reinaldo Augusto Da CostaBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica 2004-04-05Acesso online. A biblioteca também possui exemplares impressos. |
|
7 |
Material Type: Dissertação de Mestrado
|
Aprendizado por reforço profundo para navegação visual semântica com memóriaSantos, Iury Batista De AndradeBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação 2020-11-27Acesso online |
|
8 |
Material Type: Dissertação de Mestrado
|
Aprendizado por reforço relacional para o controle de robôs sociáveisSilva, Renato Ramos DaBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação 2009-03-10Acesso online. A biblioteca também possui exemplares impressos. |
|
9 |
Material Type: Tese de Doutorado
|
DeepRLGUIMAT: Deep Reinforcement Learning-based GUI Mobile Application Testing ApproachRibeiro, Eliane Figueiredo CollinsBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação 2022-03-30Acesso online |
|
10 |
Material Type: Dissertação de Mestrado
|
Controle supervisório de microrredes utilizando deep reinforcement learningBarbalho, Pedro Inácio De Nascimento EBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola de Engenharia de São Carlos 2021-02-17Acesso online |