非线性激活函数的使用原因

最新推荐文章于 2023-09-07 21:37:39 发布

一只tobey

最新推荐文章于 2023-09-07 21:37:39 发布

阅读量823

点赞数 1

分类专栏：方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zz2230633069/article/details/89040767

版权

方法专栏收录该内容

15 篇文章 0 订阅

订阅专栏

解释一：如果是线性激活函数：输出y`是输入x的线性组合，那么无论神经网络有多少层，一直在做的只是计算线性激活函数，所以不如直接去掉全部隐含层。线性隐含层一点用都没有，因为两个线性函数的组合本身就是线性组合。所以除非引入非线性，那么无法计算更加有趣的函数，网络层数再多也不行。只有一个地方可以使用线性激活函数，就是如果要机器学习的就是回归问题，要预测的y是一个实值，比如房价从0到inf，那么用线性激活函数也许可行但是影藏单元不能用线性激活函数。

所以唯一能用线性激活函数的地方通常是输出层。

解释二：从生物学的神经网络来说，突触类似于隐含层，但是树凸之间的激活并不是线性的，是电信号和化学信号的转化，是非线性传播的。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
非线性激活函数的使用原因

解释一：如果是线性激活函数：输出y`是输入x的线性组合，那么无论神经网络有多少层，一直在做的只是计算线性激活函数，所以不如直接去掉全部隐含层。线性隐含层一点用都没有，因为两个线性函数的组合本身就是线性组合。所以除非引入非线性，那么无法计算更加有趣的函数，网络层数再多也不行。只有一个地方可以使用线性激活函数，就是如果要机器学习的就是回归问题，要预测的y是一个实值，比如房价从0到inf，那么用线性激活...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。