relu/tanh激活函数+反向传播计算图

最新推荐文章于 2024-04-18 05:45:00 发布

Carr_001

最新推荐文章于 2024-04-18 05:45:00 发布

阅读量3.4k

点赞数

分类专栏：学习日记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35554139/article/details/94205786

版权

学习日记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.relu/tanh激活函数

Q:为什么要有激活函数？

A:如果没有激活函数，那么输出只是输入的线性组合，意义不大

比如:有输入x1,x2…xn,如果没有激活函数，最终的输出可以写成表达式
$z=a1\times x1+a2\times x2+..an\times xn$
这还不如直接只用一层直接输出呢，
不过，线性组合有一个很好的作用是，可以减少参数量，如下，这里可以结合QR分解来理解
在这里插入图片描述
激活函数的作用：如下面万能近似定理所述
这句话告诉我们，只要至少有一个带激活函数的隐藏单元，就可以用这个网络来近似代表任何Borel可测函数（不知道具体意义）。
Q:那只要一层是不是就可以了？
A:层数越多，其泛化能力越好，也就是泛化误差(测试误差)越小
这是作者的实验
在这里插入图片描述
relu、tanh(Hyperbolic Tangent)
这两个函数共同特点：
1.非线性
2.0附近倒数为近似1，利于学习（这也是为甚不用softplus最为中间层激活函数的原因）
3.relu(0)=0 ， tanh(0) = 0（这是为什么不用sigmoid做中间层激活函数的原因）

2.反向传播计算图

记住下面的图。。
在这里插入图片描述

总结：欠了两天的债，今天准备一口气看30页，谁知道。。。知识储备不够+稀烂翻译，看着这三十页看着真的是难受，所以就只理解了这一点内容，要学会及时调整策略，适当放弃一些内容，往后面看。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
relu/tanh激活函数+反向传播计算图

1.relu/tanh激活函数Q:为什么要有激活函数？A:如果没有激活函数，那么输出只是输入的线性组合，意义不大比如:有输入x1,x2…xn,如果没有激活函数，最终的输出可以写成表达式z=a1×x1+a2×x2+..an×xnz=a1\times x1+a2\times x2+..an\times xnz=a1×x1+a2×x2+..an×xn这还不如直接只用一层直接输出呢，不过，线性...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。