神经网络为什么需要非线性激活函数

最新推荐文章于 2023-08-16 09:52:20 发布

AItrust

最新推荐文章于 2023-08-16 09:52:20 发布

阅读量1.9k

点赞数 1

分类专栏： Python笔记神经网络文章标签：神经网络深度学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42067550/article/details/105244538

版权

Python笔记同时被 2 个专栏收录

56 篇文章 14 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

刚开始接触深度学习的小伙伴一定会有一个疑问：我们为什么需要设置激活函数呢？为什么这个激活函数需要是非线性的呢？

本文会就这个问题做一些探讨！

首先来看一个最简单的神经网络：
在这里插入图片描述

首先，神经网络需要经过前向传播，于是在每一个节点上，我们要经历的是一次线性变化，和一次非线性激活。

给定输入 x：
$z^{[1]} = W^{[1]}x + b^{[1]}$
$a^{[1]} = g^{[1]}(z^{[1]})$
$z^{[2]} = W^{[2]}x + b^{[2]}$
$a^{[2]} = g^{[2]}(z^{[2]})$

z表示线性变换，a表示非线性变换。
这里我们用的非线性函数 $g^{[1]}( )$ 可以是ReLU，可以是 tanh ，有或者是 sigmoid。

那假设我们不再设置非线性函数，那表达式会变为：
$z^{[1]} = W^{[1]}x + b^{[1]}$
$a^{[1]} = z^{[1]}$
$z^{[2]} = W^{[2]}x + b^{[2]}$
$a^{[2]} = z^{[2]}$

经过推导，可得：
$a^{[2]} = (W^{[2]}W^{[1]})x + (W^{[2]}b^{[1]}+b^{[2]})$
其实就等于：
$a^{[2]} = W^{'}x + b^{'}$
也就是说，我们的多层神经网络被简化成了单层的线性回归网络！我们设置神经网络隐藏层的意义也就消失了！

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。