使用Gaussian-ReLU RBM以及ReLU-ReLU RBM的注意事项！！！

最新推荐文章于 2022-05-13 00:01:41 发布

哈代的随想

最新推荐文章于 2022-05-13 00:01:41 发布

阅读量824

点赞数 1

分类专栏：机器学习与人工智能文章标签：受限玻尔兹曼机机器学习算法高斯 ReLU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hardysong/article/details/81175472

版权

机器学习与人工智能专栏收录该内容

10 篇文章 0 订阅

订阅专栏

最近在实现Gaussian-ReLU RBM的过程中总是遇到学习到的权重为NaN的情况，学习算法为CD方法。后来发现，这个问题主要是由于学习速率设置过大而导致的，以下是根据一些文献和自己的尝试给出的相关RBM训练参数的设置意见：

（1）对于Gaussian-ReLU RBM：学习速率不应设置过大，一般在0.001或低于这个水平，否则会出现训练梯度爆炸的情况，在实际应用中表现出的是训练误差在几次迭代下降后迅速放大，直至Inf或NaN。(reference: Vinod Nair and Geoffrey Hinton. 2010)

（2）对于ReLU-ReLU RBM：学习速率应该设置的更小，具体多小需要做实验进行尝试，我自己设置的大概的0.00001或低于这个水平。(Geoffrey Hinton, 2010, A Practical Guide to Training Restricted Boltzmann Machines----特别说一下祖师爷在文章中特别说过对于这种情况需要much smaller learning rate，自己采坑了来回看了好几次也没注意到这个细节，可见我对文章细节的把握还是不够呀)

（3）如果是多层的RBM叠加的DBN，通过实验观测，对学习速率的设置最好是逐层递减的。

哈代的随想

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
使用Gaussian-ReLU RBM以及ReLU-ReLU RBM的注意事项！！！

最近在实现Gaussian-ReLU RBM的过程中总是遇到学习到的权重为NaN的情况，学习算法为CD方法。后来发现，这个问题主要是由于学习速率设置过大而导致的，以下是根据一些文献和自己的尝试给出的相关RBM训练参数的设置意见：（1）对于Gaussian-ReLU RBM：学习速率不应设置过大，一般在0.001或低于这个水平，否则会出现训练梯度爆炸的情况，在实际应用中表现出的是...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。