CNN中为什么使用ReLu作为激活函数

最新推荐文章于 2023-05-28 20:57:25 发布

Kangrant

最新推荐文章于 2023-05-28 20:57:25 发布

阅读量4.1k

点赞数 2

分类专栏：吴恩达深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kangrant/article/details/106857964

版权

吴恩达深度学习专栏收录该内容

5 篇文章 2 订阅

订阅专栏

为什么要使用激活函数？

我们训练的神经网络模型，就是从输入到输出的一个神秘未知函数映射。我们并不知道具体的内容，只能尽可能无限的逼近它。
如果不使用激活函数，那么输出只能是线性的。
如果使用了非线性激活函数，那么就可以输出非线性函数，就可以无限逼近复杂函数。

为什么激活函数必须是非线性的？

如果是线性激活函数，不管隐藏层多深，输出永远是输入的线性组合，这样就与没有隐藏层结果相当，所以需要引入非线性激活函数。

为什么CNN中要使用ReLu？

1.使用sigmoid时，涉及到指数运算，反向传播时求导涉及到除法，计算量大。而采用ReLu函数时，整个过程计算节省很多

2.sigmoid容易产生梯度消失（在sigmoid接近饱和区时，变换太缓慢，导数趋于0，这种情况会造成信息丢失。）

3.ReLu会使一部分神经元输出为0，造成网络的稀疏性，减少了参数之间的依存性，减少了过拟合的情况

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
CNN中为什么使用ReLu作为激活函数

为什么要使用激活函数？我们训练的神经网络模型，就是从输入到输出的一个神秘未知函数映射。我们并不知道具体的内容，只能尽可能无限的逼近它。如果不使用激活函数，那么输出只能是线性的。如果使用了非线性激活函数，那么就可以输出非线性函数，就可以无限逼近复杂函数。为什么激活函数必须是非线性的？如果是线性激活函数，不管隐藏层多深，输出永远是输入的线性组合，这样就与没有隐藏层结果相当，所以需要引入非线性激活函数。为什么CNN中要使用ReLu？1.使用sigmoid时，涉及到指数运算，反向传播时求导涉及到除法，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。