"Pessimism"的相关文档

Combining Pessimism with Optimism for Robust and Efficient Model-Based Deep Reinforcement Learning

CombiningPessimismwithOptimismforRobustandEfﬁcientModel-BasedDeepReinforcementLearningSebastianCuri1IlijaBogunovic1AndreasKrause1Abstractunpredictableways.Themaingoalisthentolearnapolicythatprovab...

for and with Robust Combining

2023-11-16 18:11:2316254.17 MB12

Is Pessimism Provably Efficient for Offline RL

Combining Pessimism with Optimism for Robust and Efficient Model-Based Deep Reinforcement Learning