Result Number | Material Type | Add to My Shelf Action | Record Details and Options |
---|---|---|---|
1 |
Material Type: Dissertação de Mestrado
|
![]() |
Model-based policy gradients: an empirical study on linear quadratic environmentsLovatto, Ângelo GregórioBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2022-06-17Acesso online. A biblioteca também possui exemplares impressos. |
2 |
Material Type: Tese de Doutorado
|
![]() |
Mudanças em problemas de planejamento sem soluçãoMenezes, Maria Viviane DeBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2014-10-30Acesso online. A biblioteca também possui exemplares impressos. |
3 |
Material Type: Dissertação de Mestrado
|
![]() |
Compressão de modelos em transferência de aprendizado de máquinaMoraes, Paula Kintschev Santana DeBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2021-12-14Acesso online. A biblioteca também possui exemplares impressos. |
4 |
Material Type: Tese de Doutorado
|
![]() |
Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagationBueno, Thiago PereiraBiblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2021-08-31Acesso online. A biblioteca também possui exemplares impressos. |
5 |
Material Type: Artigo de Congresso
|
![]() |
Aprendizado por reforço em lote para o problema de tomada de decisão em processos de vendaDenis Antonio Lacerda Leliane Nunes de Barros; Encontro Nacional de Inteligência Artificial e Computacional - ENIAC (2014 São Carlos)Proceedings Belo Horizonte: UFMG, 2014Belo Horizonte UFMG 2014Acesso online. A biblioteca também possui exemplares impressos. |
6 |
Material Type: Artigo de Congresso
|
![]() |
Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learningÂngelo Gregório Lovatto Thiago Pereira Bueno; Leliane Nunes de Barros; Brazilian Conference on Intelligent Systems (BRACIS) (8. 2019 Salvador)Proceedings Piscataway : IEEE, 2019Piscataway IEEE 2019Localização: IME - Inst. Matemática e Estatística (PROD-2980007 )(Acessar) |
7 |
Material Type: Artigo de Congresso
|
![]() |
Using concept hierarchies in knowledge discoveryMarco Eugênio Madeira Di Beneditto Leliane Nunes de Barros; Brazilian Symposium on Artificial Intelligence - SBIA (17. 2004 São Luis, MA)Proceedings Berlin : Springer, 2004Berlin Springer 2004Localização: IME - Inst. Matemática e Estatística (PROD-3037430 )(Acessar) |
8 |
Material Type: Artigo de Congresso
|
![]() |
Gradient estimation in model-based reinforcement learning a study on linear quadratic environmentsÂngelo Gregório Lovatto Thiago Pereira Bueno; Leliane Nunes de Barros; Brazilian Conference on Intelligent Systems - BRACIS (10. 2021 Virtual Event)Proceedings Cham: Springer, 2021Cham Springer 2021Localização: IME - Inst. Matemática e Estatística (PROD-3063781 )(Acessar) |
9 |
Material Type: Livro
|
![]() |
Proceedings of the IBERAMIA/SBIA 2000 Workshops Workshop on Artificial Intelligence and Computer Vision: Workshop on Probabilistic Reasoning in Artifical Intelligence : Meeting on Multi-Agent Collaborative and Adversarial Perception, Planning, Execution, and LearningLeliane Nunes de Barros Roberto Marcondes César Júnior; Fabio Gagliardi Cozman 1967-; Anna Helena Reali Costa 1960-; Iberoamerican Conference on Artificial Intelligence (7. 2000 Atibaia, SP); Brazilian Conference on Artificial Intelligence (15. 2000 Atibaia, SP); Workshop on Artificial Intelligence and Computer Vision - WAICV (2000 Atibaia, SP); Workshop on Probabilistic Reasoning in Artificial Intelligence - PRAI (2000 Atibaia, SP); Meeting on Multi-Agent Collaborative and Adversarial Perception, Planning, Execution, and Learning - MAPPEL (2000 Atibaia, SP)São Paulo Tec Art 2000Localização: EPBC - Esc. Politécnica-Bib Central (004.8 W892i 1. ) e outros locais(Acessar) |
10 |
Material Type: Artigo de Congresso
|
![]() |
Deep reactive policies for planning in stochastic nonlinear domainsThiago Pereira Bueno Leliane Nunes de Barros; Denis Deratani Mauá; Scott Sanner; AAAI Conference on Artificial Intelligence (33. 2019 Honolulu, Hawaii, USA)Proceedings Palo Alto : AAAI, 2019Palo Alto AAAI 2019Localização: IME - Inst. Matemática e Estatística (PROD-2954406 )(Acessar) |