为什么要使用非线性激活函数

最新推荐文章于 2024-05-10 17:12:30 发布

1051450906

最新推荐文章于 2024-05-10 17:12:30 发布

阅读量4.7k

点赞数 6

分类专栏：深度学习中的疑惑

原文链接：https://blog.csdn.net/yjl9122/article/details/70198357

版权

深度学习中的疑惑专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.为什么要使用非线性激活函数？

线性可分的情况下：逻辑回归和线性回归，无论是闭解形式还是凸优化都能高度拟合，但是线性不可分的情况下（XOR异或函数），需要非线性对换数据的分布进行重新映射。对神经网络我们在神经网络中，对每一层线性变换后叠加一个非线性激活函数，以避免多层网络等效于单层线性函数，从而获得更大的学习与拟合能力。

使用激活函数的目的是为了向网络中加入非线性因素；加强网络的表示能力，解决线性模型无法解决的问题

（1）非线性。线性激活层对于深层神经网络没有作用，因为其作用以后仍然是输入的各种线性变换。。
（2）连续可微。梯度下降法的要求。
（3）范围最好不饱和，当有饱和的区间段时，若系统优化进入到该段，梯度近似为0，网络的学习就会停止。
（4）单调性，当激活函数是单调时，单层神经网络的误差函数是凸的，好优化。
（5）在原点处近似线性，这样当权值初始化为接近0的随机值时，网络可以学习的较快，不用可以调节网络的初始值。

2.为什么加入非线性因素能够加强网络的表示能力？——神经网络的万能近似定理

神经网络的万能近似定理认为主要神经网络具有至少一个非线性隐藏层，那么只要给予网络足够数量的隐藏单元，它就可以以任意的精度来近似任何从一个有限维空间到另一个有限维空间的函数。

如果不使用非线性激活函数，那么每一层输出都是上层输入的线性组合；

此时无论网络有多少层，其整体也将是线性的，这会导致失去万能近似的性质

但仅部分层是纯线性是可以接受的，这有助于减少网络中的参数。

关注

6
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
为什么要使用非线性激活函数

1.为什么要使用非线性激活函数？线性可分的情况下：逻辑回归和线性回归，无论是闭解形式还是凸优化都能高度拟合，但是线性不可分的情况下（XOR异或函数），需要非线性对换数据的分布进行重新映射。对神经网络我们在神经网络中，对每一层线性变换后叠加一个非线性激活函数，以避免多层网络等效于单层线性函数，从而获得更大的学习与拟合能力。使用激活函数的目的是为了向网络中加入非线性因素；加强网络的表示能力，解决线性模型无法解决的问题（1）非线性。线性激活层对于深层神经网络没有作用，因为其作用以后仍然是输入的各种线性.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。