A Practical Guide to Training Restricted Boltzmann Machines 中文翻译

本文档是关于训练受限玻尔兹曼机(RBM)的实践经验分享,涵盖了对比散度学习、超参数调整、监测学习过程和防止过拟合等方面。RBM在图像、语音等领域有广泛应用,并在深度信念网络中作为学习模块。文章强调了训练过程中稳定操作经验的重要性,包括学习率、权重初始值等超参数的设定,以及如何有效地收集统计数据。
摘要由CSDN通过智能技术生成

− − − − − − − − − − − − − − − − − − − − − − − −
受 限 玻 尔 兹 曼 机 的 实 用 训 练 指 南
第 一 版
− − − − − − − − − − − − − − − − − − − − − − − −
多 伦 多 大 学 计 算 机 科 学 实 验 室

目录

1 导论

受限玻尔兹曼机能作为生成模型,被用于有标签或无标签的图片数据(Hinton et al., 2006a),代表语音的梅尔频率倒谱系数窗口(Mohamed et al., 2009),表示文档的词袋(Salakhutdinov and Hinton, 2009),和电影评分(Salakhutdinov et al., 2007)。在特定条件下,它能处理像视频,运动中的数据(Taylor et al., 2006),或者语音之类的高维序列数据。它最成功的应用便是在深度信念网络中作为学习的模块(Hinton et al., 2006a)。

一般地,我们会使用对比散度学习程序来训练受限玻尔兹曼机(Hinton, 2002)。这就要求较为稳定的操作经验来设置诸如学习率,动力系数,权值损失,稀疏目标,权值初始值,隐藏节点数量,每一批量的大小等超参数。同时,还要决定使用什么类型的节点,是随机更新他们的状态还是确定的更新他们的状态?对每个训练样例要更新多少次隐藏节点的状态?是用数据向量来启动每个序列的状态还是用其他的呢?此外,如何检测学习的进程以及何时停止训练也是非常有用的。

对于任何的实际应用,代码必须要给出这些超参数的详尽规范。但它并不能解释为什么要这么选择,或者微小的改变如何影响模型训练的?更为糟糕的是,在新的应用场景下如何选择超参数?它也没有为新手提供任何指导。这就要求有敏感的启发思考和觉察导致学习失败相关联的超参数。

在过去的几年里,多伦多大学的机器学习小组在训练受限玻尔兹曼机上已经取得了相当多经验,这个指南就是分享他们以及其他机器学习研究者的经验的一次尝试。我们仍然处于学习曲线的陡峭上升期,所以这个指南是一个动态的文档,我们会时不时地更新它,所以它的版本会越来越多。

2 受限玻尔兹曼机与对比散度概览

如果你已经了解了受限玻尔兹曼机,你就可以跳过这一部分了。

考虑一个二维向量的训练集,出于目的的考虑,我们假设它是二维图片。训练集能被用到只有两层神经网络的受限玻尔兹曼机模型(Smolensky, 1986; Freund and Haussler, 1992; Hinton, 2002),在模型中,二维像素是随机的,二维特征检测器则对称加权连接。像素对应受限玻尔兹曼机的可见节点,因为它是可以被观测到的;特征检测器对应隐藏节点。一次重构,可见层与隐藏层 (v,h) ( v , h ) 的能量定义为:

E(v,h)=ivisibleaivijhiddenbjhji,jvihjwij E ( v , h ) = − ∑ i ∈ v i s i b l e a i v i − ∑ j ∈ h i d d e n b j h j − ∑ i , j v i h j w i j
这里的 vi.hj v i . h j 是可见节点i与隐藏节点j的两种状态,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值