"Reinforcement"的相关文档

标签“Reinforcement”的相关文档，共211条

Reinforcement Learning with Deep Energy-Based Policies
ReinforcementLearningwithDeepEnergy-BasedPoliciesTuomasHaarnoja1HaoranTang2PieterAbbeel134SergeyLevine1Abstractstochasticpoliciesaredesirableforexploration,thisex-plorationistypicallyattainedheuris...
Learning with Reinforcement Deep Energy-Based
2023-11-12 20:45:0719112.18 MB28
下载文档
Neural Optimizer Search with Reinforcement Learning
NeuralOptimizerSearchwithReinforcementLearningIrwanBello1BarretZoph1VijayVasudevan1QuocV.Le1AbstractFigure1.AnoverviewofNeuralOptimizerSearch.Wepresentanapproachtoautomatetheprocessrentnetworkcontr...
Learning Neural with Reinforcement Search
2023-11-12 20:44:5310681.2 MB4
下载文档
Modular Multitask Reinforcement Learning with Policy Sketches
ModularMultitaskReinforcementLearningwithPolicySketchesJacobAndreas1DanKlein1SergeyLevine1Abstractτ1:makeplanksΠ1τ2:makesticksΠ2b1:getwoodK1π1Wedescribeaframeworkformultitaskdeepre-b2:useworkb...
Learning with Reinforcement Policy Multitask
2023-11-12 20:44:4918732.48 MB28
下载文档
Minimax Regret Bounds for Reinforcement Learning
MinimaxRegretBoundsforReinforcementLearningMohammadGheshlaghiAzar1IanOsband1RémiMunos1AbstractThemostcommonapproachtothislearningproblemistoseparatetheprocessofestimationandoptimization.Weconsider...
Learning for Reinforcement Regret bounds
2023-11-12 20:44:481617405.06 KB16
下载文档
FeUdal Networks for Hierarchical Reinforcement Learning
FeUdalNetworksforHierarchicalReinforcementLearningAlexanderSashaVezhnevets1SimonOsindero1TomSchaul1NicolasHeess1MaxJaderberg1DavidSilver1KorayKavukcuoglu1Abstractchallenging,sincetheagenthastolearn...
Learning for Networks Reinforcement Hierarchical
2023-11-12 20:44:237831.24 MB3
下载文档
Fairness in Reinforcement Learning
FairnessinReinforcementLearning⇤ShahinJabbariMatthewJosephMichaelKearnsJamieMorgensternAaronRoth1Abstracttingswherehistoricalcontextcanhaveadistinctinﬂuenceonthefuture.Forconcreteness,weconsidert...
Learning Reinforcement in Fairness
2023-11-12 20:44:221927530.97 KB21
下载文档
Device Placement Optimization with Reinforcement Learning
DevicePlacementOptimizationwithReinforcementLearningAzaliaMirhoseini12HieuPham12QuocV.Le1BenoitSteiner1RasmusLarsen1YuefengZhou1NaveenKumar3MohammadNorouzi1SamyBengio1JeffDean1Abstractetal.,2015;Wu...
Learning Optimization with Reinforcement Device
2023-11-12 20:44:12845442.63 KB9
下载文档
Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability
DeepDecentralizedMulti-taskMulti-AgentReinforcementLearningunderPartialObservabilityShayeganOmidshaﬁei1JasonPazis1ChristopherAmato2JonathanP.How1JohnVian3Abstractpartialobservabilityandlimitedcomm...
Learning Reinforcement Deep Multi-Agent Decentralized
2023-11-12 20:44:0817921.05 MB9
下载文档
DARLA Improving Zero-Shot Transfer in Reinforcement Learning
DARLA:ImprovingZero-ShotTransferinReinforcementLearning111111IrinaHigginsArkaPalAndreiRusuLoicMattheyChristopherBurgessAlexanderPritzel111MatthewBotvinickCharlesBlundellAlexanderLerchnerAbstractef...
Learning Reinforcement in DARLA Improving
2023-11-12 20:44:0718124.56 MB28
下载文档
Counterfactual Data-Fusion for Online Reinforcement Learners
CounterfactualData-FusionforOnlineReinforcementLearnersAndrewForney1JudeaPearl1EliasBareinboim2AbstractInthiswork,westudytheconditionsunderwhichdatacol-lectedunderheterogeneousconditions(tobedeﬁne...
for Online Reinforcement Counterfactual Data-Fusion
2023-11-12 20:44:061490400.17 KB16
下载文档
An Alternative Softmax Operator for Reinforcement Learning
AnAlternativeSoftmaxOperatorforReinforcementLearningKavoshAsadi1MichaelL.Littman1AbstractAnidealsoftmaxoperatorisaparameterizedsetofoperatorsthat:Asoftmaxoperatorappliedtoasetofvaluesactssomewhatli...
Learning for An Alternative Softmax
2023-11-12 20:43:5014821.25 MB18
下载文档

首页上页 7 8 9 10 11 下页尾页