"Reinforcement"的相关文档 - 文库宝

开通VIP限时优惠

|

登录 | 注册

标签“Reinforcement”的相关文档，共211条

REPAINT Knowledge Transfer in Deep Reinforcement Learning
REPAINT:KnowledgeTransferinDeepReinforcementLearningYunzheTao1SahikaGenc1JonathanChung1TaoSun1SunilMallya1Abstractimproveperformanceonothertasks.AcceleratinglearningprocessesforcomplextasksTransfer...
Learning Reinforcement Deep in Transfer
2023-11-16 19:41:3112335.59 MB16
下载文档
Reinforcement Learning with Prototypical Representations
ReinforcementLearningwithPrototypicalRepresentationsDenisYarats12RobFergus1AlessandroLazaric2LerrelPinto1Abstractfromrewardsaloneissampleinefﬁcientandleadstopoorperformance.Priorwork(Srinivasetal....
Learning Representations with Reinforcement Prototypical
2023-11-16 19:41:3111422.51 MB7
下载文档
Reinforcement Learning Under Moral Uncertainty
ReinforcementLearningUnderMoralUncertaintyAdrienEcoffet12JoelLehman12AbstractWhilesuchaccomplishmentsaresigniﬁcant,progresshasbeenlessstraight-forwardinapplyingRLtounstructuredAnambitiousgoalforma...
Learning Reinforcement under Uncertainty Moral
2023-11-16 19:41:301798361.6 KB18
下载文档
Reinforcement Learning of Implicit and Explicit Control Flow Instructions
ReinforcementLearningofImplicitandExplicitControlFlowinInstructionsEthanA.Brooks1JanarthananRajendran1RichardL.Lewis2SatinderSingh1Abstracttaskinstructionsthatrequiretheagenttolearncontrolﬂoweithe...
Learning of and Reinforcement Control
2023-11-16 19:41:309691.55 MB14
下载文档
Reinforcement Learning for Cost-Aware Markov Decision Processes
ReinforcementLearningforCost-AwareMarkovDecisionProcessesWesleyA.Suttle1KaiqingZhang2ZhuoranYang3DavidN.Kraemer1JiLiu4Abstractquentlyusedinpractice.Nevertheless,alternativeobjectiveshaveseenincreas...
Learning for Reinforcement Markov Decision
2023-11-16 19:41:301656528.56 KB18
下载文档
Quantum algorithms for Reinforcement learning with a generative model
QuantumAlgorithmsforReinforcementLearningwithaGenerativeModelDaochenWang1AarthiSundaram2RobinKothari2AshishKapoor3MartinRoetteler2Abstractfasteralgorithmsforcertaintaskslikesearchandfactor-ing(Grov...
Learning for Generative Algorithms with
2023-11-16 19:28:371536405.27 KB14
下载文档
PsiPhi-Learning Reinforcement Learning with Demonstrations using Successor Features and Inverse Temporal Difference Learning
PsiPhi-Learning:ReinforcementLearningwithDemonstrationsusingSuccessorFeaturesandInverseTemporalDifferenceLearningAngelosFilos1ClareLyle1YarinGal1SergeyLevine2NatashaJaques23GregoryFarquhar4Abstract...
Learning Using with Reinforcement Demonstrations
2023-11-16 19:28:359534.23 MB7
下载文档
Provably Efficient Reinforcement Learning for Discounted MDPs with Feature Mapping
ProvablyEfﬁcientReinforcementLearningforDiscountedMDPswithFeatureMappingDongruoZhou1JiafanHe1QuanquanGu1Abstractlinearfunctionsorneuralnetworkstomapstatesandactionstoalow-dimensionalspaceandsolvet...
Learning for Efficient Reinforcement Provably
2023-11-16 19:28:341195361.96 KB29
下载文档
PEBBLE Feedback-Efficient Interactive Reinforcement Learning via Relabeling Experience and Unsupervised Pre-training
PEBBLE:Feedback-EfﬁcientInteractiveReinforcementLearningviaRelabelingExperienceandUnsupervisedPre-trainingKiminLee1LauraSmith1PieterAbbeel1AbstractKober&Peters,2011;Koberetal.,2013;Silveretal.,201...
Learning Reinforcement via Interactive PEBBLE
2023-11-16 19:28:2816966.86 MB12
下载文档
PC-MLP Model-based Reinforcement Learning with Policy Cover Guided Exploration
PC-MLP:Model-basedReinforcementLearningwithPolicyCoverGuidedExplorationYudaSong1WenSun2Abstractsuccessrate0.5HandEgg0.4Model-basedReinforcementLearning(RL)isa0.3DeepPC-MPL200000popularlearningparad...
Learning with Reinforcement Cover Model-Based
2023-11-16 19:28:2817373.18 MB23
下载文档
On-Policy Deep Reinforcement Learning for the Average-Reward Criterion
On-PolicyDeepReinforcementLearningfortheAverage-RewardCriterionYimingZhang1KeithW.Ross21AbstractHaarnojaetal.,2018)orinaqueuingscenario(Tadepalli&Ok,1994;Sutton&Barto,2018),thereisnonaturalsep-Wede...
Learning for Reinforcement Deep the
2023-11-16 19:28:241004805.15 KB2
下载文档
Recomposing the Reinforcement Learning Building Blocks with Hypernetworks
RecomposingtheReinforcementLearningBuildingBlockswithHypernetworksEladSaraﬁan1ShaiKeynan1SaritKraus1AbstractResBlockmetavariablePrimarynetLinearBlock256ResBlockTheReinforcementLearning(RL)building...
Learning with Reinforcement the Blocks
2023-11-16 19:28:2319871.17 MB27
下载文档
Randomized Exploration in Reinforcement Learning with General Value Function Approximation
RandomizedExplorationforReinforcementLearningwithGeneralValueFunctionApproximationHaqueIshfaq12QiwenCui3VietNguyen12AlexAyoub4ZhuoranYang5ZhaoranWang6DoinaPrecup127LinF.Yang8Abstractwhengeneralfunc...
Learning with Reinforcement in Exploration
2023-11-16 19:28:235662.86 MB10
下载文档
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning
RandomizedEntity-wiseFactorizationforMulti-AgentReinforcementLearningShariqIqbal1ChristianA.SchroederdeWitt2BeiPeng2WendelinBo¨hmer3ShimonWhiteson2FeiSha14AbstractFigure1:Breakawaysub-scenarioinso...
Learning for Reinforcement Multi-Agent Factorization
2023-11-16 19:28:235833.08 MB21
下载文档
On Reinforcement Learning with Adversarial Corruption and Its Application to Block MDP
OnReinforcementLearningwithAdversarialCorruptionandItsApplicationtoBlockMDPTianhaoWu12YunchangYang3SimonS.Du4LiweiWang35Abstractisvulnerabletocorrupteddatastemmingfrommaliciousentities(Huangetal.,2...
Learning Adversarial and with Reinforcement
2023-11-16 19:15:451520368.88 KB8
下载文档
Offline Reinforcement Learning with Fisher Divergence Critic Regularization
OfﬂineReinforcementLearningwithFisherDivergenceCriticRegularizationIlyaKostrikov12JonathanTompson2RobFergus13OﬁrNachum2Abstractwheredeployinganewpolicytointeractwiththeliveen-vironmentisexpensive...
Learning with Reinforcement Fisher Divergence
2023-11-16 19:15:415161.56 MB16
下载文档
Offline Reinforcement Learning with Pseudometric Learning
OfﬂineReinforcementLearningwithPseudometricLearningRobertDadashi1ShidehRezaeifar2NinoVieillard13Le´onardHussenot14OlivierPietquin1MatthieuGeist1Abstractthatgeneratedtheseexperiences(Pomerleau,199...
Learning with Reinforcement Offline Pseudometric
2023-11-16 19:15:4117365.3 MB1
下载文档
Near-Optimal Model-Free Reinforcement Learning in Non-Stationary Episodic MDPs
Near-OptimalModel-FreeReinforcementLearninginNon-StationaryEpisodicMDPsWeichaoMao1KaiqingZhang1RuihaoZhu2DavidSimchi-Levi2TamerBas¸ar1Abstractthroughsequentialinteractionswithaninitiallyunknownbut...
Learning Reinforcement in Model-Free Near-Optimal
2023-11-16 19:15:3312191.42 MB20
下载文档
Near Optimal Reward-Free Reinforcement Learning
NearlyOptimalReward-FreeReinforcementLearningZihanZhang1SimonS.Du2XiangyangJi1AbstractRLisexplorationforwhichtheagentneedstostrategicallyvisitnewstatestolearntransitionandrewardinformationWestudyth...
Learning Reinforcement Optimal Near Reward-Free
2023-11-16 19:15:321890712.26 KB4
下载文档
MURAL Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven Reinforcement Learning
MURAL:Meta-LearningUncertainty-AwareRewardsforOutcome-DrivenReinforcementLearningKevinLi1AbhishekGupta1VitchyrPong1AshwinReddy1AurickZhou1JustinYu1SergeyLevine1AbstractFigure1.MURAL:Ourmethodtrains...
for Reinforcement Meta-Learning Rewards Uncertainty-Aware
2023-11-16 19:15:3216204.49 MB15
下载文档

首页上页 1 2 3 4 5 下页尾页

确认删除?

VIP会员服务
限时5折优惠