skip to main content
Refinado por: Nome da Publicação: Arxiv remover nível superior: Revistas revisadas por pares remover
Result Number Material Type Add to My Shelf Action Record Details and Options
1
A Contextual Bandit Bake-off
Material Type:
Artigo
Adicionar ao Meu Espaço

A Contextual Bandit Bake-off

Bietti, Alberto ; Agarwal, Alekh ; Langford, John

Journal of machine learning research, 2021-01, Vol.22 (133), p.1-49 [Periódico revisado por pares]

Ithaca: Cornell University Library, arXiv.org

Texto completo disponível

2
On the Approximation of Cooperative Heterogeneous Multi-Agent Reinforcement Learning (MARL) using Mean Field Control (MFC)
Material Type:
Artigo
Adicionar ao Meu Espaço

On the Approximation of Cooperative Heterogeneous Multi-Agent Reinforcement Learning (MARL) using Mean Field Control (MFC)

Washim Uddin Mondal ; Agarwal, Mridul ; Aggarwal, Vaneet ; Ukkusuri, Satish V

arXiv.org, 2022-01 [Periódico revisado por pares]

Ithaca: Cornell University Library, arXiv.org

Texto completo disponível

Buscando em bases de dados remotas. Favor aguardar.