数学公式推导_梯度_gradient

最新推荐文章于 2023-10-04 22:00:00 发布

aa_lh

最新推荐文章于 2023-10-04 22:00:00 发布

阅读量1.8k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45808526/article/details/119275060

版权

数学公式推导_梯度_gradient

核心
$\theta _{t+1}=\theta _t-\alpha _t\nabla f\left( \theta _t \right) \tag{1}$
Example

Function:
$J\left( \theta _1,\theta _2 \right) =\theta _{1}^{2}+\theta _{1}^{2}\tag{2}$

Objective:
$\underset{\theta _1,\theta _2}{\min}J\left( \theta _1,\theta _2 \right) \tag{3}$

Update rules:
$\theta _1:=\theta _1-\alpha \frac{d}{d\theta _1}J\left( \theta _1,\theta _2 \right) \tag{4}$
$\theta _2:=\theta _2-\alpha \frac{d}{d\theta _2}J\left( \theta _1,\theta _2 \right) \tag{5}$

Derivatives:
$\frac{d}{d\theta _1}J\left( \theta _1,\theta _2 \right) =\frac{d}{d\theta _1}\theta _{1}^{2}+\frac{d}{d\theta _1}\theta _{2}^{2}=2\theta _1\tag{6}$

$\frac{d}{d\theta _2}J\left( \theta _1,\theta _2 \right) =\frac{d}{d\theta _2}\theta _{1}^{2}+\frac{d}{d\theta _2}\theta _{2}^{2}=2\theta _2\tag{7}$

常见函数的梯度
一次
$x w + b$
$\nabla \left( w,b \right) =\left( x,1 \right)$
二次
$xw^2+b^2$

$\nabla =\left( 2wx,2b \right)$

指数
$xe^w+e^b$

$\nabla =\left( xe^w,e^b \right)$

复合
$\left[ y-\left( wx+b \right) \right] ^2$

$\nabla =\left( 2x\left( y-\left( wx+b \right) \right) ,2\left( y-\left( xw+b \right) \right) \right)$

log
$y\log \left( wx+b \right)$

$\nabla =\left( \frac{y}{wx+b}x,\frac{y}{wx+b} \right)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。