"Evaluation"的相关文档 - 文库宝

开通VIP限时优惠

|

登录 | 注册

标签“Evaluation”的相关文档，共29条

State Relevance for Off-Policy Evaluation
StateRelevanceforOff-PolicyEvaluationSimonP.Shen1YechengJasonMa2OmerGottesman3FinaleDoshi-Velez1Abstractimportantasmanydomainshavetrajectorieswithdifferentlengths:inhealthsettings,patients’lengtho...
for Off-Policy Evaluation State Relevance
2023-11-16 19:41:5714116.09 MB29
下载文档
Self-Paced Context Evaluation for Contextual Reinforcement Learning
Self-PacedContextEvaluationforContextualReinforcementLearningTheresaEimer1Andre´Biedenkapp2FrankHutter23MariusLindauer1AbstractFigure1:ExampleinstancesofthecontextualPointMassenvironment.Theagent...
Learning for Reinforcement Evaluation Contextual
2023-11-16 19:41:44611961.78 KB26
下载文档
Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting Pot
ScalableEvaluationofMulti-AgentReinforcementLearningwithMeltingPotJoelZ.Leibo1EdgarDue´n˜ez-Guzma´n1AlexanderSashaVezhnevets1JohnP.Agapiou1PeterSunehag1RaphaelKoster1JaydMatyas1CharlesBeattie1Ig...
Learning of with Reinforcement Evaluation
2023-11-16 19:41:4117792.13 MB5
下载文档
Optimal Off-Policy Evaluation from Multiple Logging Policies
OptimalOff-PolicyEvaluationfromMultipleLoggingPoliciesNathanKallus1YutaSaito1MasatoshiUehara1AbstractInmostoftheabovestudies,theobservationsusedtoevalu-ateanewpolicyareassumedgeneratedbyasinglelogg...
from Optimal Multiple Off-Policy Evaluation
2023-11-16 19:28:251447434.3 KB23
下载文档
Model-Free and Model-Based Policy Evaluation when Causality is Uncertain
Model-FreeandModel-BasedPolicyEvaluationwhenCausalityisUncertainDavidBruns-Smith1Abstractunobservedshocksareoftenassumedtobedrawniidev-eryperiod.ConsidertheFederalReserveBoardadjustingWhendecision-...
and Model-Based Model-Free Evaluation Policy
2023-11-16 19:15:2611701.65 MB7
下载文档
Mandoline Model Evaluation under Distribution Shift
MANDOLINE:ModelEvaluationunderDistributionShiftMayeeChen1KaranGoel1NimitSohoni2FaitPoms1KayvonFatahalian1ChristopherRe´1Abstracttionerstodetermineiftheirmodelswillperformwellwhendeployed.Unfortuna...
Model Evaluation under Distribution Shift
2023-11-16 19:05:131636673.2 KB11
下载文档
GeomCA Geometric Evaluation of Data Representations
GeomCA:GeometricEvaluationofDataRepresentationsPetraPoklukar1AnastasiaVarava1DanicaKragic1Abstractlearningandrobotics,usefulnessofrepresentationsisevalu-atedontheperformanceofthepolicy(Ghadirzadehe...
of Representations Data Evaluation Geometric
2023-11-16 18:46:4616042.69 MB14
下载文档
Average-Reward Off-Policy Policy Evaluation with Function Approximation
Average-RewardOff-PolicyPolicyEvaluationwithFunctionApproximationShangtongZhang1YiWan2RichardS.Sutton2ShimonWhiteson1Abstractwhichaimtogenerateapolicythatmaximizestherewardratebyiterativelyimprovin...
Approximation with Off-Policy Evaluation Policy
2023-11-16 18:07:401794882.77 KB14
下载文档
Active Testing Sample-Efficient Model Evaluation
ActiveTesting:Sample–EfﬁcientModelEvaluationJannikKossen1SebastianFarquhar1YarinGal1TomRainforth2AbstractDifferencetoFullTestLoss×10−2I.I.D.Acquisition5ActiveTestingWeintroduceanewframeworkfors...
Active Model Evaluation Testing Sample-Efficient
2023-11-16 18:00:24820684 KB10
下载文档
Reliable Evaluation of adversarial robustness with an ensemble of diverse parameter-free attacks
ReliableEvaluationofAdversarialRobustnesswithanEnsembleofDiverseParameter-freeAttacksFrancescoCroce1MatthiasHein1Abstractvariationsareusingotherlosses(Zhangetal.,2019b)andboostrobustnessviagenerati...
of Adversarial An with Evaluation
2023-11-14 21:46:091427724.06 KB11
下载文档
On the Relation between Quality-Diversity Evaluation and Distribution-Fitting Goal in Text Generation
OntheRelationbetweenQuality-DiversityEvaluationandDistribution-FittingGoalinTextGenerationJianingLi12YanyanLan12JiafengGuo12XueqiCheng12Abstractbymaximumlikelihoodestimation(MLE)(Mikolovetal.,2010)...
and on the Evaluation between
2023-11-14 21:45:349871008.35 KB13
下载文档
Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation
Minimax-OptimalOff-PolicyEvaluationwithLinearFunctionApproximationYaqiDuan1ZeyuJia2MengdiWang34Abstractvalue)tobeearnedbyanewpolicybasedonloggedhistory.Thispaperstudiesthestatisticaltheoryofoff-Int...
Approximation with Off-Policy Evaluation Linear
2023-11-14 21:45:1113212.5 MB14
下载文档
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions
InterpretableOff-PolicyEvaluationinReinforcementLearningbyHighlightingInﬂuentialTransitionsOmerGottesman1JosephFutoma1YaoLiu2SonaliParbhoo1LeoAnthonyCeli3EmmaBrunskill2FinaleDoshi-Velez1Abstractan...
Learning Reinforcement by in Off-Policy
2023-11-14 21:44:4210861.78 MB29
下载文档
Doubly robust off-policy Evaluation with shrinkage
Doublyrobustoff-policyEvaluationwithshrinkageYiSu1MariaDimakopoulou2AkshayKrishnamurthy3MiroslavDud´ık3Abstractsubroutinesforoptimizingapolicy(Dud´ıketal.,2011).Weproposeanewframeworkfordesigni...
with Robust Off-Policy Evaluation Doubly
2023-11-14 21:43:557701.8 MB14
下载文档
Distributionally Robust Policy Evaluation and Learning in Offline Contextual Bandits
DistributionallyRobustPolicyEvaluationandLearninginOfﬂineContextualBanditsNianSi1FanZhang1ZhengyuanZhou2JoseBlanchet1Abstractnomenonintheseapplications,canbeintelligentlyexploitedtoachievebetterou...
Learning and Robust in Evaluation
2023-11-14 21:43:518461.35 MB3
下载文档
Adaptive Estimator Selection for Off-Policy Evaluation
AdaptiveEstimatorSelectionforOff-PolicyEvaluationYiSu1PavithraSrinath2AkshayKrishnamurthy2Abstracthighqualityestimationashasbeendemonstratedinrecentempiricalstudies(Voloshinetal.,2019).However,data...
Adaptive for Selection Off-Policy Evaluation
2023-11-14 21:42:581227397.75 KB23
下载文档
Accountable Off-Policy Evaluation via a Kernelized Bellman Statistics
AccountableOff-PolicyEvaluationWithKernelBellmanStatisticsYihaoFeng1TongzhengRen1ZiyangTang1QiangLiu1Abstractdecisions.Off-policyEvaluationplaysanimportantroleinImportancesampling(IS)providesabasic...
via Off-Policy Evaluation Bellman Kernelized
2023-11-14 21:42:561995792.13 KB29
下载文档
Rehashing Kernel Evaluation in High Dimensions
RehashingKernelEvaluationinHighDimensionsParisSiminelakis1KexinRong1PeterBailis1MosesCharikar1PhilipLevis1Abstract(a)kernel(b)difﬁcultcase(c)simplecaseKernelmethodsareeffectivebutdonotscalewellFig...
Kernel in High Dimensions Evaluation
2023-11-13 14:48:2310211.4 MB6
下载文档
More Efficient Off-Policy Evaluation through Regularized Targeted Learning
MoreEfﬁcientOff-PolicyEvaluationthroughRegularizedTargetedLearningAure´lienF.Bibaut1IvanaMalenica1NikosVlassis2MarkJ.vanderLaan1Abstractinference,andhasledtomanymethodologicaldevelop-ments.Oneoft...
Efficient through Off-Policy Evaluation Regularized
2023-11-13 14:47:541032874.6 KB13
下载文档
Importance Sampling Policy Evaluation with an Estimated Behavior Policy
ImportanceSamplingPolicyEvaluationwithanEstimatedBehaviorPolicyJosiahP.Hanna1ScottNiekum1PeterStone1Abstractdeterminetheexpectedreturn–sumofrewards–thatanEvaluationpolicy,πe,willobtainwhendeploy...
Sampling An with Evaluation Policy
2023-11-13 14:47:2811191.92 MB10
下载文档

首页上页 1 2 下页尾页

确认删除?

VIP会员服务
限时5折优惠