优化概率神经网络_无需任何训练即可获得最佳的神经网络性能

最新推荐文章于 2024-02-27 17:18:19 发布

weixin_39748773

最新推荐文章于 2024-02-27 17:18:19 发布

阅读量452

点赞数

文章标签：优化概率神经网络

本文探讨了神经网络过参数化现象，指出随机初始化的网络为何能表现出与训练后的网络相似的性能。传统的正则化并非解决泛化问题的关键，而是神经网络修剪提供了新的视角。彩票假说认为，神经网络中存在「中奖彩票」子网，即使大幅度修剪权重也能保持性能。通过迭代幅度修剪和边缘弹出算法，可以从随机权重的网络中找到具有竞争力的子网，挑战了我们对深度学习和训练过程的理解。

摘要由CSDN通过智能技术生成

这是 @小白遇见AI 的第 24 篇推文

应该如何解释神经网络过参数化的现象呢？

当我们尝试用最近的研究来回答这个问题时，我们会发现我们对神经网络的了解比我们想象的要少得多，并且并不理解为什么随机初始化的网络可以像训练有素的网络一样好。

在更标准的机器学习实践中，会通过池化，以尽量减少模型参数的数量，以防止过度拟合，确保真正的学习，而不是死记硬背。另一方面，机器学习工程师只是不断地填充神经网络，使其变得越来越大，并且以某种方式起作用。这违反了常识。

现代神经网络在训练集上达到99.9％甚至100％的准确性并不少见，这通常是警告过度拟合。但是，令人惊讶的是，神经网络可以达到类似的高测试集分数。

关于神经网络为什么不会过拟合的一个常见答案是正则化的作用。不幸的是，事实并非如此-在Zhang等人进行的一项研究中，没有各种正则化方法的Inception架构的性能并没有比具有正则化的体系结构差很多。因此，不能说正则化是泛化的基础。

最低0.47元/天解锁文章

weixin_39748773

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
优化概率神经网络_无需任何训练即可获得最佳的神经网络性能

这是 @小白遇见AI 的第 24 篇推文应该如何解释神经网络过参数化的现象呢？当我们尝试用最近的研究来回答这个问题时，我们会发现我们对神经网络的了解比我们想象的要少得多，并且并不理解为什么随机初始化的网络可以像训练有素的网络一样好。在更标准的机器学习实践中，会通过池化，以尽量减少模型参数的数量，以防止过度拟合，确保真正的学习，而不是死记硬背。另一方面，机器学习工程师只是不断地填充神经网络...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。