[深度学习]人工神经网络中激励函数作用详解

最新推荐文章于 2025-02-24 19:08:51 发布

图解AI

最新推荐文章于 2025-02-24 19:08:51 发布

阅读量1.3w

点赞数 6

分类专栏：深度学习与算法笔记文章标签：神经网络深度学习

未经博主允许不得转载(https://github.com/ai-word)

本文链接：https://blog.csdn.net/baihuaxiu123/article/details/62228330

版权

深度学习与算法笔记专栏收录该内容

17 篇文章

订阅专栏

本文解析了在神经网络中激活函数的作用，介绍了线性和非线性问题的区别，并通过实例说明了如何利用激活函数解决非线性问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这里写图片描述

前言

业余时间,看了关于深度学习方面的知识,对人工神经网络中激励函数存在疑惑,查阅资料,总结给大家,一起学习.

激励函数作用

不使用激励函数的话，神经网络的每层都只是做线性变换，多层输入叠加后也还是线性变换。因为线性模型的表达能力不够，激励函数可以引入非线性因素。其实很多时候我们更想直观的了解激励函数的是如何引入非线性因素的。

通俗的理解

就是因为, 现实并没有我们想象的那么美好, 它是残酷多变的. 哈哈, 开个玩笑, 不过激励函数也就是为了解决我们日常生活中不能用线性方程所概括的问题. 好了,我知道你的问题来了.

什么是线性方程 (linear function)?

这里写图片描述

非线性方程

说到线性方程, 我们不得不提到另外一种方程, 非线性方程 (nonlinear function). 我们假设, 女生长得越漂亮, 越多男生爱. 这就可以被当做一个线性问题. 但是如果我们假设这个场景是发生在校园里. 校园里的男生数是有限的, 女生再漂亮, 也不可能会有无穷多的男生喜欢她. 所以这就变成了一个非线性问题.再说..女生也不可能是无穷漂亮的. 这个问题我们以后有时间私下讨论.

这里写图片描述

然后我们就可以来讨论如何在神经网络中达成我们描述非线性的任务了. 我们可以把整个网络简化成这样一个式子. Y = Wx, W 就是我们要求的参数, y 是预测值, x 是输入值. 用这个式子, 我们很容易就能描述刚刚的那个线性问题, 因为 W 求出来可以是一个固定的数. 不过这似乎并不能让这条直线变得扭起来 , 激励函数见状, 拔刀相助, 站出来说道: “让我来掰弯它!”.

下面来具体给大家解释一下:
在很多数据中,有些数据是可以线性可分的,说的意思就是,我们可以用一条直线就可以把数据进行分开,比如下图:
这里写图片描述

这时候你需要通过一定的机器学习的方法，比如感知机算法(perceptron learning algorithm) 找到一个合适的线性方程。
但是有些数据不是线性可分的。比如如下数据：
这里写图片描述
上图数据你就没有办法画出一条直线来将数据区分开.
这时候有两个办法，第一个办法，是做线性变换(linear transformation)，比如讲x,y变成x^2,y^2，这样可以画出圆形。如图所示：

如果将坐标轴从x,y变为以x^2,y^2为标准，你会发现数据经过变换后是线性可分的了。大致示意图如下：
这里写图片描述