"Exploration-Exploitation"的相关文档

Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning

EfﬁcientBias-Span-ConstrainedExploration-ExploitationinReinforcementLearningRonanFruit1MatteoPirotta1AlessandroLazaric2RonaldOrtner3Abstractand,ateachstep,itexecutesthepolicywithhighestopti-mistic...

2023-11-13 11:59:301711517.31 KB27

Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning

Adaptive Exploration-Exploitation Tradeoff for Opportunistic Bandits