"Reinforcement"的相关文档 - 文库宝

开通VIP限时优惠

|

登录 | 注册

标签“Reinforcement”的相关文档，共211条

UneVEn Universal Value Exploration for Multi-Agent Reinforcement Learning
UneVEn:UniversalValueExplorationforMulti-AgentReinforcementLearningTarunGupta1AnujMahajan1BeiPeng1WendelinBo¨hmer2ShimonWhiteson1Abstractfactorization,thejointactionvaluefunctioncanbedecen-trallym...
for Reinforcement Multi-Agent Exploration Value
2023-11-16 19:42:1812852.84 MB30
下载文档
Uncertainty Weighted Actor-Critic for Offline Reinforcement Learning
UncertaintyWeightedActor-CriticforOfﬂineReinforcementLearningYueWu12ShuangfeiZhai1NitishSrivastava1JoshuaSusskind1JianZhang1RuslanSalakhutdinov2HanlinGoh1Abstractleveragingpriorexperience(Langeeta...
Learning for Reinforcement Uncertainty Actor-Critic
2023-11-16 19:42:1713508.62 MB14
下载文档
Towards Better Laplacian Representation in Reinforcement Learning with Generalized Graph Drawing
TowardsBetterLaplacianRepresentationinReinforcementLearningwithGeneralizedGraphDrawingKaixinWang1KuangqiZhou1QixinZhang2JieShao3BryanHooi1JiashiFeng1AbstractFigure1.VisualizationofenvironmentandLap...
Learning Reinforcement in Representation Better
2023-11-16 19:42:0912372.67 MB26
下载文档
Tesseract Tensorised Actors for Multi-Agent Reinforcement Learning
Tesseract:TensorisedActorsforMulti-AgentReinforcementLearningAnujMahajan1MikayelSamvelyan2LeiMao3ViktorMakoviychuk3AnimeshGarg3JeanKossaiﬁ3ShimonWhiteson1YukeZhu3AnimashreeAnandkumar3Abstractarise...
Learning for Reinforcement Multi-Agent Tesseract
2023-11-16 19:42:031019831.89 KB4
下载文档
Structured World Belief for Reinforcement Learning in POMDP
StructuredWorldBeliefforReinforcementLearninginPOMDPGautamSingh1SkandPeri1JunghyunKim1HyunseokKim2SungjinAhn13Abstractgeneralizationtonovelscenes(Chenetal.,2020).Object-centricworldmodelsprovidestr...
Learning for Reinforcement in Structured
2023-11-16 19:41:5914001.01 MB18
下载文档
Spectral Normalisation for Deep Reinforcement Learning An Optimisation Perspective
SpectralNormalisationforDeepReinforcementLearning:AnOptimisationPerspectiveFlorinGogianu12TudorBerariu3MihaelaRosca45ClaudiaClopath34LucianBusoniu2RazvanPascanu4AbstractFigure1:Optimisationrivalsal...
Learning for An Reinforcement Deep
2023-11-16 19:41:555752.24 MB19
下载文档
Sparse Feature Selection Makes Batch Reinforcement Learning More Sample Efficient
SparseFeatureSelectionMakesBatchReinforcementLearningMoreSampleEfﬁcientBotaoHao1YaqiDuan2TorLattimore1CsabaSzepesva´ri13MengdiWang21Abstract1.IntroductionThispaperprovidesastatisticalanalysisofhi...
Learning Feature Selection Sparse Reinforcement
2023-11-16 19:41:53605379.19 KB2
下载文档
Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks
Shortest-PathConstrainedReinforcementLearningforSparseRewardTasksSungryullSohn12SungtaeLee3JongwookChoi1HarmvanSeijen4MehdiFatemi4HonglakLee21AbstractMoreover,thesuccessoftheRLalgorithmheavilyhinge...
Learning for Sparse Reinforcement Constrained
2023-11-16 19:41:4795513.79 MB27
下载文档
Self-Paced Context Evaluation for Contextual Reinforcement Learning
Self-PacedContextEvaluationforContextualReinforcementLearningTheresaEimer1Andre´Biedenkapp2FrankHutter23MariusLindauer1AbstractFigure1:ExampleinstancesofthecontextualPointMassenvironment.Theagent...
Learning for Reinforcement Evaluation Contextual
2023-11-16 19:41:44611961.78 KB26
下载文档
SCC an efficient deep Reinforcement learning agent mastering the game of StarCraft II
SCC:anEfﬁcientDeepReinforcementLearningAgentMasteringtheGameofStarCraftIIXiangjunWang1JunxiaoSong1PenghuiQi1PengPeng1ZhenkunTang1WeiZhang1WeiminLi1XiongjunPi1JujieHe1ChaoGao1HaitaoLong1QuanYuan1Ab...
Learning Efficient An Reinforcement Deep
2023-11-16 19:41:4318121.31 MB28
下载文档
Scaling Multi-Agent Reinforcement Learning with Selective Parameter Sharing
ScalingMulti-AgentReinforcementLearningwithSelectiveParameterSharingFilipposChristianos1GeorgiosPapoudakis1ArrasyRahman1StefanoV.Albrecht1Abstract(e.g.(Guptaetal.,2017))wherebyagentssharesomeorallp...
Learning with Reinforcement Multi-Agent Scaling
2023-11-16 19:41:429304.45 MB13
下载文档
Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting Pot
ScalableEvaluationofMulti-AgentReinforcementLearningwithMeltingPotJoelZ.Leibo1EdgarDue´n˜ez-Guzma´n1AlexanderSashaVezhnevets1JohnP.Agapiou1PeterSunehag1RaphaelKoster1JaydMatyas1CharlesBeattie1Ig...
Learning of with Reinforcement Evaluation
2023-11-16 19:41:4117792.13 MB5
下载文档
Sample Efficient Reinforcement Learning In Continuous State Spaces A Perspective Beyond Linearity
SampleEfﬁcientReinforcementLearningInContinuousStateSpaces:APerspectiveBeyondLinearityDhruvMalik1AldoPacchiano2VishwakSrinivasan1YuanzhiLi1Abstractsuchabenchmark(Bellemareetal.,2013).Agentstrained...
Learning Efficient Reinforcement in Sample
2023-11-16 19:41:391099382.37 KB4
下载文档
Safe Reinforcement Learning with Linear Function Approximation
SafeReinforcementLearningwithLinearFunctionApproximationSanaeAmani1ChristosThrampoulidis2LinF.Yang1Abstractactionmayleadtocatastrophicresults.Thus,safetyinRLhasbecomeaseriousissuethatrestrictstheap...
Learning Approximation with Reinforcement Linear
2023-11-16 19:41:391105663.7 KB15
下载文档
Safe Reinforcement Learning Using Advantage-Based Intervention
SafeReinforcementLearningUsingAdvantage-BasedInterventionNolanWagener1ByronBoots2Ching-AnCheng3AbstractFigure1.Advantage-basedinterventionofSAILRandconstruc-tionofthesurrogateMDPM.InM,wheneverthepo...
Learning Using Reinforcement Safe Intervention
2023-11-16 19:41:391816907.47 KB24
下载文档
RRL Resnet as representation for Reinforcement Learning
RRL:ResnetasrepresentationforReinforcementLearningRutavShah1VikashKumar2AbstractSupervisedLearningTheabilitytoautonomouslylearnbehaviorsviaReinforcementdirectinteractionsinuninstrumentedenviron-Lea...
Learning for Reinforcement Representation as
2023-11-16 19:41:396467.08 MB19
下载文档
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees
RobustReinforcementLearningusingLeastSquaresPolicyIterationwithProvablePerformanceGuaranteesKishanPanaganti1DileepKalathil1AbstractThismismatchbetweenthetrainingandtestingenvironmentparameterscansi...
Learning Using Reinforcement Robust Policy
2023-11-16 19:41:3814402.55 MB14
下载文档
Risk-Sensitive Reinforcement Learning with Function Approximation A Debiasing Approach
Risk-SensitiveReinforcementLearningwithFunctionApproximation:ADebiasingApproachYingjieFei1ZhuoranYang2ZhaoranWang1Abstractrisk-seekingobjectiveandβ<0inducesarisk-averseone.ItcanalsobeseenthatVβte...
Learning Approximation with Reinforcement Function
2023-11-16 19:41:35675326.21 KB4
下载文档
Reward Identification in Inverse Reinforcement Learning
RewardIdentiﬁcationinInverseReinforcementLearningKunoKim1KirankumarShiragur1ShivamGarg1StefanoErmon1AbstractMDPstobuildcomputationalmodels(Niv,2009)ofreal-world,rationaldecisionmakerssuchasinvesto...
Learning Identification Reinforcement in Inverse
2023-11-16 19:41:34829707.94 KB14
下载文档
Revisiting Peng’s Q($λ$) for Modern Reinforcement Learning
RevisitingPeng’sQ(λ)forModernReinforcementLearningTadashiKozuno1YunhaoTang2MarkRowland3Re´miMunos4StevenKapturowski3WillDabney3MichalValko4DavidAbel3Abstract1996;Watkins,1989;Peng&Williams,1994;...
Learning for Reinforcement Modern Revisiting
2023-11-16 19:41:3310963.25 MB10
下载文档

首页上页 1 2 3 4 5 下页尾页

确认删除?

VIP会员服务
限时5折优惠