Deep learning：二十一(随机初始化在无监督特征学习中的作用)

最新推荐文章于 2024-04-16 12:53:51 发布

Vincent8080

最新推荐文章于 2024-04-16 12:53:51 发布

阅读量165

点赞数 1

文章标签：人工智能数据库数据结构与算法

　　这又是Ng团队的一篇有趣的paper。Ng团队在上篇博客文章Deep learning：二十(无监督特征学习中关于单层网络的分析)中给出的结论是：网络中隐含节点的个数，convolution尺寸和移动步伐等参数比网络的层次比网络参数的学习算法本身还要重要，也就是说即使是使用单层的网络，只要隐含层的节点数够大，convolution尺寸和移动步伐较小，用简单的算法（比如kmeans算法）也可取得不亚于其它复杂的deep learning最优效果算法。而在本文On random weights and unsupervised feature learning中又提出了个新观点：即根本就无需通过那些复杂且消耗大量时间去训练网络的参数的deep learning算法，我们只需随机给网络赋一组参数值，其最终取得的特征好坏不比那些预训练和仔细调整后得到的效果些，而且这样还可以减少大量的训练时间。

　　以上两个结论不免能引起大家很多疑惑，既然这么多人去研究深度学习，提出了那么多深度学习的算法，并构建了各种深度网络结构，而现在却发现只需用单层网络，不需要任何深度学习算法，就可以取得接近深度学习算法的最优值，甚至更好。那么深度学习还有必要值得研究么？单层网络也就没有必要叫深度学习了，还是叫以前的神经网络学习算了。这种问题对于我这种菜鸟来说是没法解答的，还是静观吧，呵呵。

　　文章主要是回答两个问题：1. 为什么随机初始化有时候能够表现那么好？ 2. 如果用无监督学习的方法来预赋值，用有监督学习的方法来微调这些值，那这些方法的作用何在？

　　针对第一个问题，作者认为随机初始化网络参数能够取得很好的效果是因为，如果网络的结构确定了，则网络本身就对输入的数据由一定的选择性，比如说会选择频率选择性和平移不变性。其公式如下：