04反向传播

本课程内容是学习 刘二大人的《PyTorch深度学习实践》的04反向传播。

上节内容:

我们讲了优化问题,梯度下降算法核心公式以及鞍点问题的解决方法——随机梯度下降。

本节内容:

目录

1. 一个简单的两层神经网络

2. 链式求导

3. 过程

4.Tensor

5.代码



1. 一个简单的两层神经网络

下图是一个简单的两层神经网络。X 是输入,W 是权重,b1是偏置。(MM 代表相乘,ADD 代表相加)

它的网络模型:

但是呢,我们可以发现:不管有多少层,最终都可以化成简单的一层。

但是这样一直是线性的,所以我们要引入一个 \sigma(Nonlinear Function)。

(关于非线性函数后续会讲到)

2. 链式求导

求导这个知识点,高数里面就有,大家应该都懂得。(这种链式法则,大家都懂吧)

创建计算图。

这里,我们做了前馈运算(Forward),也就是按着输入箭头方向。另外,其实就是做了这个Z关于X输入和w权重的导数。

这个Loss,再做对Z的偏导,这是往回算。

这里有个具体的例子:(注意,这个\frac{\partial L}{\partial w}=5 这时假设)

3. 过程

绿色部分是前向传播;橙色部分是反向传播。

4.Tensor

Tensor 是 pytorch 里面最基本的数据类型,它可以存标量、向量、矩阵。

它包含着两部分,一个是数值,一个是梯度导数。这样就可以构建计算图。

5.代码

构建计算图所需的代码工作:

# 准备数据集并保存
import torch

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

w = torch.Tensor([1.0])
# 设定计算梯度
w.requires_grad = True


def forward(x):
    return x * w


def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y) ** 2


print('Predict (before training)', 4, forward(4).item())
# 训练过程
for epoch in range(100):
    for x, y in zip(x_data, y_data):
        l = loss(x, y)
        l.backward()
        print('\tgrad:', x, y, w.grad.data.item())
        w.data = w.data - 0.01 * w.grad.data
        w.grad.data.zero_()
    print('Epoch:', epoch, l.item())

print('Predict (after training)', 4, forward(4).item())

结果:


下节内容是刘二大人的《PyTorch深度学习实践》的 05 用PyTorch实现线性回归。

  • 11
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值