优化器及自动化调超参数

调节超参数是深度学习中成本最高的部分之一。 当前最先进的优化器,例如Adagrad, RMSProp 和 Adam,通过为每个变量灵活地调整学习速率来简化工作,并取得了良好的效果。

Adam是一种有效的随机优化方法,只需要一阶梯度和少量内存。该方法通过估计梯度的第一和第二力矩来计算不同参数的适应性学习速率。Adam的名字来源于适应性力矩估计。该方法在设计上结合了两种流行方法的优势,包括在稀疏梯度上有效的AdaGrad和在在线和非固定设置中有效的RMSProp。Adam的优点有参数更新的级数与梯度规模调整无关,步长大致受stepsize参数制约。它不要求固定的对象,能用于稀疏梯度,并执行步长退火。

RMSPop是一种与Adam密切相关的优化方法,有时与动能结合使用。使用动能的RMSProp通过对重缩放梯度使用动能来生成参数更新,而Adam通过平均梯度的第一和第二力矩的直接估计来更新。RMSProp也缺少一个偏差更正项,而这项在稀疏梯度情况下非常重要,没有对偏差的更正会导致步长过大以及无法收敛。

AdaGrad是一种对稀疏梯度有效的算法。

其他的一些随机优化方法包括vSGD, AdaDelta,以及自然牛顿方法,SFO等。

但是一些实验以及Wilson等提出的理论认为,手动调整随机梯度下降(SGD)取得的效果更好,并能实现相同甚至更快的速率,提出的假设是自适应方法会收敛到不同的最小值。另一个提出的观点是上述的这些方法都没有调整它们的动能参数,而它在深度学习应用中已被证明非常重要。调整动能参数在异步平行系统中更为重要,近期理论显示异步引入了类似动能的动力,因此调低函数的动能对于有效的平行化很是重要。

深度学习研究者提出了许多优化超参数的方法。简单的如网格搜索,但它仅适用于一些非常小的问题,否则会因过于昂贵而无法使用。智慧黑盒方法不显式考虑问题的设定而测试不同设置。自适应方法提供了一个吸引人的选择,在运行时一次性调节很大程度上成功地将实验者从调整学习速率中解脱出来。类似于Adagrad, RMSProp 和 Adam这样的函数,使用梯度元素的级数为每个变量单独调整学习速率。这种灵活性听上去不错,但一些实验和近期的分析显示调整多学习速率的方法与动能SGD相比效果相当。Wilson等认为这种方法在泛化上效果更差。而自适应方法无法调整动能参数也是它的不利因素。

动能是加速优化的核心参数,最常使用的加速方法就以此命名,被称为动能。经典和近期的研究都表明合理的动能调节对于训练速度有深刻的影响,而在分布式系统中动能的作为更为关键。最近Mitliagkas等展现了在异步平行系统——一种有效分布式训练的流行设计——系统在优化中引入了类似动能的动力,因此应将函数动能降低以得到快速收敛。在近期的一项合作验证了对动能的调节能在千个节点规模上提升收敛。

加速的随机梯度下降(SGD),首先由Polyak和Nesterov等提出,已成为深度学习中默认的训练函数。使用它需要对超参数如学习速率和动能参数进行合理选择。但是选择超参数几乎是深度学习中最费时间的部分,很多人经过反复实验后大致勾勒了调节实践中应遵循的一些方法。

简单的动能SGD函数手动调整单个学习速率和动能值取得的效果可与Adam相当,并且它在学习速率错误设定和对象曲率变动具有抗干扰性。近期斯坦福大学研究组基于此设计了YelloFin,一个在SGD自动调整动能和学习速率的调节器。YelloFin可选择使用一个新的动能感知组件并结合负反馈循环机制来补偿在运行中异步导致的增加动力。研究组通过实证展示YelloFin与Adam相比在大规模的ResNet和LSTM模型中以更少的迭代收敛,同步设定中快2.8倍,异步设定中快2.7倍。

相关论文 YelloFin and the Art of Momentum Tuning   点击打开链接


  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
##KodExplorer (http://kalcaddle.com/) ###ver2.61(2014.7.12) `商业版授权请联系:kalcaddle#qq.com` #### 1.是什么: - Kodexplorer为千帆网络工作室开发的一款服务器文件管理程序。 - 完美取代FTP管理:可用于服务器文件管理,zip解压缩 备份还原、支持图片、音乐、视频预览、office、pdf等格式在线预览。文件夹拖拽上传……。 - 在线编程:支持几乎所有编程语言的在线编辑(高亮,多光标编辑.堪比本地的sublime) - 极佳的操作体验:及其便捷的快捷键支持,让你拥有本地化的体验 - 中文等多语言支持:中文编码全面兼容,文件编辑自动适配。 - 超快的速度:全面采用Ajax+Json进行数据通信,毫秒级的响应速度; - 全平台兼容性:Win Linux Mac (Apache、Nginx、IIS) #### 2.使用场景: - 取代FTP,服务端、客户端软件等复杂的安装配置。kod可以一键安装随处使用. - 你可以用它来管理你的服务器(备份,在线解压缩,版本发布....) - 你可以把他当做管理linux的一个操作系统界面 - 可以用来作为私有云存储系统,存储你的文件... - 当然你也可以用来分享文件 - Web IDE / browser code editor awesomeness - 更多场景等你来挖掘!…… #### 3.使用说明 管理员: admin/admin 普通用户:demo/demo 游客用户:guest/guest [如何使用] 下载程序,解压上传到你的服务器路径下,data目录设置777权限。访问体验超便捷的服务吧! (data目录没有写权限会导致配置修改不能保存、不能新建用户等) [关于上传问题] 程序没有做任何限制,如果需要上传大文件,则修改 php.ini:`upload_max_filesize = 1000M post_max_size = 1000M` [关于解压缩问题] 程序不做任何限制,如若失败请设置php内存限制。memory_limit 1000M [关于兼容性] 建议使用chrome firefox ie9+ 体验更完整。ie8以下基本上不做兼容处理。chrome支持文件夹拖拽上传。 [文件打开] office文件在线预览功能,服务器必须在公网(外部能访问该服务器) [忘记密码] 修改data/system/member.php 密码为明文的md5值 例如将admin密码重设为admin 则修改第一行:"name":"admin","password":"21232f297a57a5a743894a0e4a801fc3" ![](https://cloud.githubusercontent.com/assets/3761968/2583304/764f562a-b9cf-11e3-8e59-afdbdffc20eb.png) ###ver2.61 `2014/7/12` ---- ####update: - 实时搜索,根据搜索框内容变化,实时选中匹配到的结果; - 弹出搜索框遍历子文件夹递归搜索 - session key 加入kod_前缀 避免和其他系统key冲突 - 编辑器选中优化 选择鼠标到窗口外事件处理 ####fix bug:(bug解决和程序优化) - backspace后退截获浏览器事件,作为后退前一次访问的文件夹; - 搜索首字母不匹配问题 - 弹出层中的弹出层关闭,父窗口失去焦点问题。 - 代码中grunt部分代码拆分开,放到程序外面;提交到git、osc - 桌面:删除alert enter快捷键删除 - install 检测 加入跳过,(只判断用到的函数) 加入多语言 - zip压缩没有权限 提示红色,false 统一查找 - 登录成功后 验证码输错清除 - 非root用户拖拽到文件夹问题 - 非root解压问题 不能解压 - list oexe 图标问题 - 用户目录不存在判断 - fileCahe 互斥锁 reset 不用 - ie 8~10样式问题整 ###ver2.6 `2014/7/6` ---- ####update: - 完全性优化;加入严格的校验机制 - 首次运行环境检测[data目录检测,必须的函数支持提示] - 上传已存在处理——创建副本(另外包括粘贴,解压) - 选中优化 ctrl选中拖拽 - 键盘快捷键选中文件,多个字符

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值