PyTorch实践(三)

最新推荐文章于 2024-09-26 16:33:29 发布

Worick

最新推荐文章于 2024-09-26 16:33:29 发布

阅读量94

点赞数

分类专栏： pytorch实践

本文链接：https://blog.csdn.net/weixin_44200581/article/details/117170899

版权

pytorch实践专栏收录该内容

3 篇文章 0 订阅

订阅专栏

梯度

凸函数可以找到全局最优解
影响搜索全局最优解的因素：

初始状态（权值需要初始化）
动量（摆脱局部最小值）
学习率（影响收敛速度与精度）

激活函数及其梯度

$f(x)=\sigma(x)=\frac{1}{1+e^{-x}}$
在这里插入图片描述
有点：连续光滑，压缩在0~1，且计算方便
缺点：梯度消失
$\begin{aligned} f(x)=& \tanh (x)=\frac{\left(e^{x}-e^{-x}\right)}{\left(e^{x}+e^{-x}\right)} \\ &=2 \operatorname{sigmoid}(2 x)-1 \end{aligned}$

$f(x)=\left\{\begin{array}{ll} 0 & \text { for } x<0 \\ x & \text { for } x \geq 0 \end{array}\right.$
$f^{\prime}(x)=\left\{\begin{array}{ll} 0 & \text { for } x<0 \\ 1 & \text { for } x \geq 0 \end{array}\right.$
减小梯度消失何梯度爆炸

loss function的梯度

MSE(均方差函数)

使用方法：

torch.autograd.grad(loss,[w1,w2,w3,…])
- [w1 grad,w2 grad…]
loss.backward()
- w1.grad
- w2.grad
- …

实例：
在这里插入图片描述

softmax函数

在这里插入图片描述
$\frac{\partial p_{i}}{\partial a_{j}}=\left\{\begin{array}{lll} p_{i}\left(1-p_{j}\right) & \text { if } & i=j \\ -p_{j} \cdot p_{i} & \text { if } & i \neq j \end{array}\right.$
实例：