"Exploration"的相关文档 - 文库宝

开通VIP限时优惠

|

登录 | 注册

标签“Exploration”的相关文档，共50条

UneVEn Universal Value Exploration for Multi-Agent Reinforcement Learning
UneVEn:UniversalValueExplorationforMulti-AgentReinforcementLearningTarunGupta1AnujMahajan1BeiPeng1WendelinBo¨hmer2ShimonWhiteson1Abstractfactorization,thejointactionvaluefunctioncanbedecen-trallym...
for Reinforcement Multi-Agent Exploration Value
2023-11-16 19:42:1812852.84 MB30
下载文档
Task-Optimal Exploration in Linear Dynamical Systems
Task-OptimalExplorationinLinearDynamicalSystemsAndrewWagenmaker1MaxSimchowitz2KevinJamieson1Abstracttaintyabouttheenvironment,anaivestrategymightbetoexploretheenvironmentuntilitisuniformlyunderstoo...
in Exploration Systems Linear Dynamical
2023-11-16 19:42:015761.23 MB18
下载文档
Skill Discovery for Exploration and Planning using Deep Skill Graphs
SkillDiscoveryforExplorationandPlanningusingDeepSkillGraphsAkhilBagaria1JasonSenthil1GeorgeKonidaris1AbstractWeintroduceanewskill-discoveryalgorithmthatbuildsadiscretegraphrepresentationoflargecon-...
for Using and Discovery Exploration
2023-11-16 19:41:5019763.9 MB6
下载文档
Robust Pure Exploration in Linear Bandits with Limited Budget
RobustPureExplorationinLinearBanditswithLimitedBudgetAyyaAlieva1AshokCutkosky2AbhimanyuDas3AbstracttheExplorationphaseshouldbesomehowefﬁcient-wewishtomakethebestuseofourlimitedbudgetinordertoWecon...
with Robust in Exploration Bandits
2023-11-16 19:41:38893463.98 KB23
下载文档
Resource Allocation in Multi-armed Bandit Exploration Overcoming Sublinear Scaling with Adaptive Parallelism
ResourceAllocationinMulti-armedBanditExploration:OvercomingSublinearScalingwithAdaptiveParallelismBrijenThananjeyan1KirthevasanKandasamy1IonStoica1MichaelI.Jordan1KenGoldberg1JosephE.Gonzalez1Abstr...
in Exploration Allocation Bandit Multi-armed
2023-11-16 19:41:3213231.29 MB2
下载文档
Pure Exploration and Regret Minimization in Matching Bandits
PureExplorationandRegretMinimizationinMatchingBanditsFloreSentenac1JialinYi2Cle´mentCalauze`nes3VianneyPerchet4MilanVojnovic´2Abstractonlineadvertising,wheretheprobabilitythatauserclicksonanaddep...
Matching and in Exploration Regret
2023-11-16 19:28:35996390.82 KB5
下载文档
Provably Correct Optimization and Exploration with Non-linear Policies
ProvablyCorrectOptimizationandExplorationwithNon-linearPoliciesFeiFeng1WotaoYin1AlekhAgarwal2LinYang3Abstractrer&Geist,2014;Geistetal.,2019;Abbasi-Yadkorietal.,2019;Agarwaletal.,2020c;Bhandari&Russ...
Optimization and with Exploration Provably
2023-11-16 19:28:34539929.05 KB11
下载文档
Principled Exploration via Optimistic Bootstrapping and Backward Induction
PrincipledExplorationviaOptimisticBootstrappingandBackwardInductionChenjiaBai1LingxiaoWang2LeiHan3JianyeHao4AnimeshGarg5PengLiu1ZhaoranWang2Abstract2007;Jinetal.,2018)isaprincipledapproachforefﬁci...
and via Exploration Principled Bootstrapping
2023-11-16 19:28:318192.72 MB20
下载文档
Randomized Exploration in Reinforcement Learning with General Value Function Approximation
RandomizedExplorationforReinforcementLearningwithGeneralValueFunctionApproximationHaqueIshfaq12QiwenCui3VietNguyen12AlexAyoub4ZhuoranYang5ZhaoranWang6DoinaPrecup127LinF.Yang8Abstractwhengeneralfunc...
Learning with Reinforcement in Exploration
2023-11-16 19:28:235662.86 MB10
下载文档
Multi-layered Network Exploration via Random Walks From Offline Optimization to Online Learning
Multi-layeredNetworkExplorationviaRandomWalks:FromOfﬂineOptimizationtoOnlineLearningXutongLiu1JinhangZuo2XiaoweiChen3WeiChen4JohnC.S.Lui1AbstractusedasaneffectivetoolfornetworkExploration(Lvetal.,...
from via random Exploration Network
2023-11-16 19:15:301090532.63 KB19
下载文档
MetaCURE Meta Reinforcement Learning with Empowerment-Driven Exploration
MetaCURE:MetaReinforcementLearningwithEmpowerment-DrivenExplorationJinZhang1JianhaoWang1HaoHu1TongChen1YingfengChen2ChangjieFan2ChongjieZhang1Abstractwithsparserewardsremainschallenging,astask-rele...
Learning with Reinforcement Exploration Meta
2023-11-16 19:05:1716072.19 MB13
下载文档
Locally Persistent Exploration in Continuous Control Tasks with Sparse Rewards
LocallyPersistentExplorationinContinuousControlTaskswithSparseRewardsSusanAmin12MaziarGomrokchi12HosseinAboutalebi34HarshSajita12DoinaPrecup12AbstractcallforacleverExplorationstrategythatexposesthe...
in Persistent Exploration Continuous Control
2023-11-16 19:05:096697.47 MB18
下载文档
Guided Exploration with Proximal Policy Optimization using a Single Demonstration
GuidedExplorationwithProximalPolicyOptimizationusingaSingleDemonstrationGabrieleLibardi1SebastianDittert1GianniDeFabritiis12AbstractLearningfromdemonstrationsallowstodirectlybypassthisproblembutito...
Using Optimization with Policy Proximal
2023-11-16 18:46:531819961.55 KB4
下载文档
Fast active learning for pure Exploration in reinforcement learning
FastactivelearningforpureExplorationinreinforcementlearningPierreMénard1OmarDarwicheDomingues2EmilieKaufmann23AndersJonsson4EdouardLeurent2MichalValko235Abstracthowtoexploreefﬁciently.Inparticula...
Learning Active for in Fast
2023-11-16 18:38:081033404.16 KB11
下载文档
Exploration in Approximate Hyper-State Space for Meta Reinforcement Learning
ExplorationinApproximateHyper-StateSpaceforMetaReinforcementLearningLuisaZintgraf1LeoFeng2CongLu1MaximilianIgl1KristianHartikainen1KatjaHofmann3ShimonWhiteson1AbstractFigure1.IllustrationoftheMeta-...
for Approximate in Exploration Space
2023-11-16 18:38:0510662.04 MB6
下载文档
Deep Coherent Exploration for Continuous Control
DeepCoherentExplorationforContinuousControlYijieZhang1HerkevanHoof2Abstractstrategiesandundirectedstrategies(Thrun,1992;Plappertetal.,2018).Whiledirectedstrategiesaimtoextractuse-Inpolicysearchmeth...
for Deep Coherent Exploration Continuous
2023-11-16 18:31:0118007.91 MB23
下载文档
Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices
DecouplingExplorationandExploitationforMeta-ReinforcementLearningwithoutSacriﬁcesEvanZheranLiu1AditiRaghunathan1PercyLiang1ChelseaFinn1Abstractanewkitchen(theenvironment)afterithaslearnedtocookoth...
Learning for and Exploration Decoupling
2023-11-16 18:30:5916582.79 MB5
下载文档
Cooperative Exploration for Multi-Agent Deep Reinforcement Learning
CooperativeExplorationforMulti-AgentDeepReinforcementLearningIou-JenLiu1UnnatJain1RaymondA.Yeh1AlexanderG.Schwing1Abstract(MADDPG)(Loweetal.,2017),andcounterfactualmulti-agentpolicygradients(COMA)(...
Learning for Reinforcement Deep Multi-Agent
2023-11-16 18:30:511093838.21 KB1
下载文档
Tightening Exploration in Upper Confidence Reinforcement Learning
TighteningExplorationinUpperConﬁdenceReinforcementLearningHippolyteBourel1Odalric-AmbrymMaillard1MohammadSadeghTalebi2Abstract1.IntroductionTheupperconﬁdencereinforcementlearningInthispaper,wecon...
Learning Reinforcement in Exploration Confidence
2023-11-14 21:46:461511624.46 KB24
下载文档
Reward-Free Exploration for Reinforcement Learning
Reward-FreeExplorationforReinforcementLearningChiJin1AkshayKrishnamurthy2MaxSimchowitz3TianchengYu4AbstractExplorationiswidelyregardedasthemostsigniﬁcantchal-lengeinRL,becausetheagentmayhavetotake...
Learning for Reinforcement Exploration Reward-Free
2023-11-14 21:46:121728339.73 KB27
下载文档

首页上页 1 2 3 下页尾页

确认删除?

VIP会员服务
限时5折优惠