神经网络隐含层的物理意义

最新推荐文章于 2025-03-25 20:14:31 发布

前进的小白

最新推荐文章于 2025-03-25 20:14:31 发布

阅读量3.2w

点赞数 42

分类专栏： machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22690765/article/details/75050943

版权

machine-learning 专栏收录该内容

1 篇文章

订阅专栏

softmax回归与多层神经网络模型

softmax回归与多层神经网络都可以实现多分类器，两种分类器的模型如下图所示：

softmax回归

softmax回归

多层神经网络

1层隐含层的神经网络

物理意义

根据图示我们可以看到，多层神经网络模型与回归模型，在原理上是相似的，都是构造线性模型，多层神经网络只是在输入层与输出层之间添加了n个隐含层(n>=1)，添加隐含层的物理意义是什么呢？

无论是softmax模型，还是多层神经网络模型，都是构造线性模型，但是当输入数据不是线性可分的，模型该怎么预测结果呢？

线性可分数据，构造一个线性二分器即可把数据分开

线性可分数据

线性不可分数据，需要构造多个二分类器对数据进行分类

线性不可分数据

多层神经网络，可以认为将原始输入数据，在每一层隐含层上做了多个二分类，二分类的个数即为该隐含层的神经元个数。如上图所示，输入数据的维度是2，即：x1和x2，对于此线性不可分的数据，可以做3个二分类器，即：y1、y2和y3，所以隐含层中有3个神经元。因此对于线性不可分的数据来说，多层神经网络比softmax回归效果理论上要好。

对于高维的数据，我们很难进行可视化，所以隐含层的层数以及每层中神经元的个数，只能通过多次训练调整。

这就是为什么多层神经网络有多个隐含层。

另外，可以参考MIT deep learning的书籍，中间有一部分解释的也很清楚，就是为了让线性不可分的数据变得线性可分：
MIT deep learnning

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。