A Modular Analysis of Provable Acceleration via Polyak’s Momentum Training a Wide ReLU Network and a Deep Linear Network

AModularAnalysisofProvableAccelerationviaPolyak’sMomentum:TrainingaWideReLUNetworkandaDeepLinearNetworkJun-KunWang1Chi-HengLin2JacobAbernethy1Abstract1.IntroductionIncorporatingaso-called“momentum”dynamicMomentummethodsareverypopularfortrainingneuralnetworksinvariousapplications(e.g.Heetal.(2016);ingradientdescentmethodsiswidelyusedinVaswanietal.(2017);Krizhevskyetal.(2012)).Ithasbeenwidelyo...

温馨提示:
本文档由用户上传,版权归属用户,文库宝负责整理代发布。如果您对本文档版权有争议请及时联系客服。

温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。

2. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。

3. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。

精品文档大全
已认证
内容提供者

分享有价值的文档,专注于学术论文、行业资料、简历模板、应用文档、教育资料、PPT等资源文档。

确认删除?
VIP会员服务
限时5折优惠
回到顶部