训练神经网络--激活函数

最新推荐文章于 2023-01-15 23:00:56 发布

error:404..

最新推荐文章于 2023-01-15 23:00:56 发布

阅读量370

点赞数

分类专栏：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41845951/article/details/118884743

版权

神经网络专栏收录该内容

13 篇文章 0 订阅

订阅专栏

目录

1.1sigmiod函数

1.4leaky relu函数

1.5maxout函数

1.激活函数

1.1sigmiod函数

这是最早期神经网络用的一种激活函数，是非线性的，将元素压缩到[0,1]上，但是在元素趋很大或者很小（负数）的时候，可以看成是线性的

sigmoid函数跟所有激活函数一样实现了元素非线性化，更加贴近于实际。

但是缺点很明显，（1）当元素处于函数的正饱和区域或者负饱和区域的时候，或出现梯度消失现象（2）sigmoid函数不是关于0对称的，梯度只会朝着一个方向更新，导致梯度更新效率低。

设一个神经元为f（∑wi*xi+bi），那么w的梯度为dl/dw=xi，而当x输入全部为正，sigmiod函数输出也是全部为正，那么wi全部为正，所以对于w的梯度是朝一个方向更新，如下图

导致每次跟新w只能向一个方向更新，正或负，导致更新如上图一直绕着正确梯度（蓝色线）更新方向更新

sigmoid函数现在用的很少。

1.2tanh函数

tanh函数相对于sigmiod函数，它是关于0对称的函数，使得它没有了sigmiod函数的第二个缺点，但是仍然跟sigmiod函数一样存在这梯度消失现象。

1.3relu函数

现在用的很多的一个函数，更加的符合人的神经工作原理，现在大多采用relu函数，相比于sigmiod函数，它更加的精确

但是同样，在负半轴上存在饱和现象，所以也存在梯度消失现象，可以直接理解为只激活正半轴上的数据

1.4leaky relu函数

没有饱和现象，里面的参数max（a*x，x）a需要通过反向传播来学习

1.5maxout函数

1.6elu函数

跟leaky relu函数相比多了负饱和现象，但是这可能会给数据带来更多的噪声，增强了数据。需要进行指数运算，运算更麻烦。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
训练神经网络--激活函数

1.激活函数1.1sigmiod函数这是最早期神经网络用的一种激活函数，是非线性的，将元素压缩到[0,1]上，但是在元素趋很大或者很小（负数）的时候，可以看成是线性的sigmoid函数跟所有激活函数一样实现了元素非线性化，更加贴近于实际。但是缺点很明显，（1）当元素处于函数的正饱和区域或者负饱和区域的时候，或出现梯度消失现象（2）sigmoid函数不是关于0对称的，梯度只会朝着一个方向更新，导致梯度更新效率低。设一个神经元为f（∑wi*xi+bi），那么w的梯度为dl/dw=x...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。