梯度（常见函数梯度推导，单层多层感知机梯度推导）

自然color

已于 2022-09-06 22:19:03 修改

阅读量795

点赞数

分类专栏： Python笔记文章标签： tensorflow python 深度学习

于 2022-08-25 19:55:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46955575/article/details/126356397

版权

目录

tensorflow自动求梯度

二阶求导（初学者几乎用不到）

激活函数及其梯度

损失函数及其梯度

单层单输出感知机推导（激活函数用sigmoid）

单层多输出感知机推导（激活函数用sigmoid）

推出隐藏层表达式（链式求导）

逐层类推反向传播

二维函数极小值求解实战

梯度：各个变量的偏导组成的向量

tensorflow自动求梯度

计算过程封装到这里面

正常计算完梯度后会自动释放（因为占GPU显存），如果想调用两次求梯度要传一个参数进去

建议及时释放资源

with tf.GradientTape(persistent=True) as tape:

二阶求导（初学者几乎用不到）

激活函数及其梯度

sigmoid

解决阶梯激活函数无法求导的问题，出现了sigmoid函数,导数是已知的

sigmoid函数致命缺陷：无穷的时候导数趋近于0，出现梯度弥散

Tanh

relu

广泛使用适合深度学习

损失函数及其梯度

MSE均方差

tape.watch([w,b]) 指定要观测的变量，运算过程中需要对w和b求导

如果w直接定义成tf.Variable()则不需要加tape.watch

Softmax 求导

放缩后，差距更大

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
梯度（常见函数梯度推导，单层多层感知机梯度推导）

梯度：各个变量的偏导组成的向量。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。