通俗理解神经网络之激励函数(Activation Function)

最新推荐文章于 2022-10-10 15:23:20 发布

原创

最新推荐文章于 2022-10-10 15:23:20 发布 · 3w 阅读

·

25

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #激励函数

本文通过对比有无激活函数的神经网络，解释了激活函数如何引入非线性因素，并展示了其对于提高神经网络性能的关键作用。

本文整理自博客、知乎上关于激励函数的博客和回答。部分图片引用自知乎，如有侵权，请联系作者。

关于神经网络激励函数的作用，常听到的解释是：不使用激励函数的话，神经网络的每层都只是做线性变换，多层输入叠加后也还是线性变换。因为线性模型的表达能力不够，激励函数可以引入非线性因素。其实很多时候我们更想直观的了解激励函数的是如何引入非线性因素的。

我们使用神经网络来分割平面空间作为例子。

无激励函数的神经网络

神经网络最简单的结构就是单输出的单层感知机，单层感知机只有输入层和输出层，分别代表了神经感受器和神经中枢。下图是一个只有2个输入单元和1个输出单元的简单单层感知机。图中x₁、w₂代表神经网络的输入神经元受到的刺激，w₁、w₂代表输入神经元和输出神经元间连接的紧密程度，b代表输出神经元的兴奋阈值，y为输出神经元的输出。我们使用该单层感知机划出一条线将平面分割开，如图所示：
这里写图片描述

同理，我们也可以将多个感知机（注意，不是多层感知机）进行组合获得更强的平面分类能力，如图所示：
这里写图片描述

再看看包含一个隐层的多层感知机的情况，如图所示：
这里写图片描述

仔细看的话不难发现，上面三种没有激励函数的神经网络的输出是线性方程，其在用复杂的线性组合来逼近曲线。

有激励函数的神经网络

我们在神

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。