利用随机前馈神经网络生成图像观察网络复杂度

最新推荐文章于 2025-01-20 14:49:01 发布

happynear

最新推荐文章于 2025-01-20 14:49:01 发布

阅读量9.1k

点赞数 7

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：神经网络可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/happynear/article/details/46583811

本文探讨了神经网络的表达能力，通过随机生成权重并可视化图像来展示不同网络结构（如ReLU、Sigmoid）及是否使用Batch Normalization对复杂度的影响。研究发现，ReLU+BN能表达最复杂函数，而Sigmoid+BN和无BN情况的表达能力受限，且后者易导致网络退化。作者还指出BN中shift参数的重要性，错误理解导致研究无法深入。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

零、声明

这是一篇失败的工作，我低估了batch normalization里scale/shift的作用。细节在第四节，请大家引以为戒。

一、前言

　　关于神经网络的作用有一个解释：它是一个万能函数逼近器。通过BP算法调整权重，在理论上神经网络可以近似出任意的函数。
　　当然，要近似出来的函数的复杂度肯定不能超过神经网络的表达能力，不然就会产生欠拟合的现象。而一个网络能承载的函数复杂度通常与隐层节点个数和深度有关。
　　本篇文章通过一种可视化的方法，来直观地表示出一个神经网络得表达能力。

二、算法

　　值得注意的是，神经网络所拟合的函数，是关于输入的连续函数。如果输入是图像的2维坐标，输出是3维的RGB颜色的话，那颜色就是坐标的连续函数，这一点是图像是否美观的一个很重要的标准。如果我们随机生成神经网络的权重，通过生成的图像的复杂程度，就能够大致看出一个网络能够表达出多么复杂的函数。

以下是生成图像的代码（基于DeepLearnToolBox，地址：https://github.com/happynear/DeepLearnToolbox）：

layers = randi(10,1,10)+10;%隐层节点数，从[10 20]随机采样

nn = nnsetup([2 layers

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。