激活函数

最新推荐文章于 2024-08-10 10:12:16 发布

zlc911202

最新推荐文章于 2024-08-10 10:12:16 发布

阅读量2.3w

点赞数

分类专栏：深度学习文章标签：激活函数神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014088052/article/details/50923924

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

激活函数的作用

神经网络为什么要使用激活函数？
首先提一下激活函数的一般形式，在我平时的学习中，我遇到过的一般是这四种形式，simoid,tanh,ReLu,softplus。

s i m o i d 函 数 也 称 S 曲 线 ： f (x) = 1 1 + e - x

$simoid 函数也称 S 曲线：f(x)=\frac{1}{1+e^{-x}}$

t a n h : f (x) = t a n h (x)

$tanh:f(x)=tanh(x)$

R e L U ： f (x) = m a x (x, 0)

$ReLU：f(x)=max(x,0)$

s o f t m a x : f (x) = l o g (1 + e x p (x))

$softmax: f(x)=log(1+exp(x))$

激活函数，并不是去激活什么，而是指如何把“激活的神经元的特征”通过函数把特征保留并映射出来（保留特征，去除一些数据中是的冗余），这是神经网络能解决非线性问题关键。

激活函数是用来加入非线性因素的，因为线性模型的表达力不够

这句话字面的意思很容易理解，但是在具体处理图像的时候是什么情况呢？我们知道在神经网络中，对于图像，我们主要采用了卷积的方式来处理，也就是对每个像素点赋予一个权值，这个操作显然就是线性的。但是对于我们样本来说，不一定是线性可分的，为了解决这个问题，我们可以进行线性变化，或者我们引入非线性因素，解决线性模型所不能解决的问题。

这里插一句，来比较一下上面的那些激活函数，因为神经网络的数学基础是处处可微的，所以选取的激活函数要能保证数据输入与输出也是可微的，运算特征是不断进行循环计算，所以在每代循环过程中，每个神经元的值也是在不断变化的。

这就导致了tanh特征相差明显时的效果会很好，在循环过程中会不断扩大特征效果显示出来，但有是，在特征相差比较复杂或是相差不是特别大时，需要更细微的分类判断的时候，sigmoid效果就好了。

还有一个东西要注意，sigmoid 和 tanh作为激活函数的话，一定要注意一定要对 input 进行归一话，否则激活后的值都会进入平坦区，使隐层的输出全部趋同，但是 ReLU 并不需要输入归一化来防止它们达到饱和。

构建稀疏矩阵，也就是稀疏性，这个特性可以去除数据中的冗余，最大可能保留数据的特征，也就是大多数为0的稀疏矩阵来表示。

其实这个特性主要是对于Relu，它就是取的max(0,x)，因为神经网络是不断反复计算，实际上变成了它在尝试不断试探如何用一个大多数为0的矩阵来尝试表达数据特征，结果因为稀疏特性的存在，反而这种方法变得运算得又快效果又好了。

所以我们可以看到目前大部分的卷积神经网络中，基本上都是采用了ReLU 函数。

关注

0
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zlc911202 CSDN认证博客专家 CSDN认证企业博客

码龄11年

10: 原创

31万+: 周排名

82万+: 总排名

9万+: 访问

: 等级

699: 积分

24: 粉丝

34: 获赞

5: 评论

65: 收藏

私信

关注

热门文章

分类专栏

最新评论

360柱状全景图拼接
zxy57816: 双线性插值那里是不是有点问题，我写成s0 = (1 - u)*(1 - v)*s1 + u*(1-v)*s2 + (1-u)* v*s3 + u*v*s4; 效果才正确。。顺带一提，这里角标也错了。
激活函数
xiaoxi_666: 写得很好，请教一个问题：文中的“这就导致了tanh特征相差明显时的效果会很好，在循环过程中会不断扩大特征效果显示出来，但有是，在特征相差比较复杂或是相差不是特别大时，需要更细微的分类判断的时候，sigmoid效果就好了。”这句话怎么理解？
360柱状全景图拼接
zlc911202 回复 Spectacules: 柱面投影是在一开始的时候使用（输入图像之后，提取特征点之前），一开始就将原图像投影成柱面图再进行特征点检测、匹配以及图像配准。
360柱状全景图拼接
Spectacules: 您好，您写的图像融合那部分我没怎么看明白，柱面投影这部分是在哪一阶段使用？是在一开始就将原图像投影成柱面图再进行特征点检测、匹配以及图像配准，还是在计算出单应性矩阵之后，根据单应性矩阵计算出图像变化后坐标再柱面投影？
BP神经网络
jacques7zhu: 卤煮讲得好清楚！有没有讲CNN的文章啊

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。