反向传播（BP）

最新推荐文章于 2024-06-22 19:02:11 发布

白御空

最新推荐文章于 2024-06-22 19:02:11 发布

阅读量652

点赞数 3

分类专栏： # Python 机器学习算法文章标签：机器学习深度学习神经网络

本文链接：https://blog.csdn.net/lhys666/article/details/121842885

版权

Python 机器学习算法专栏收录该内容

9 篇文章 1 订阅

订阅专栏

反向传播（BP）

创作背景

最近要学学 反向传播 （BP），写篇博客记录一下。

知识补充

误差反向传播，简称BP（Back Propagation）。
机器学习过程可分为 正向传播 和 反向传播。

正向传播：输入信息从输入层经隐层处理，传至输出层。每层神经元（节点）的状态只影响 下一层 神经元的状态。
反向传播：将误差信号 沿原来通路返回，修改各层权重值，使误差信号最小，得到 最佳（较佳）参数。

流程图

首先画一下流程图（用 mermaid 画出来效果看着不行，就用的 PPT 的形状一个一个画）
正向传播
反向传播

公式

正向传播
$\hat{y}={w}_{1}{x}^{2}+{w}_{2}x+b \\ r = \hat{y} - y \\ loss = {r}^{2}$
反向传播，即 损失对各权重求偏导
$\frac{\partial loss}{\partial \hat{y}}=\frac{\partial loss}{\partial r}*\frac{\partial r}{\partial \hat{y}}=2r \\ =2(\hat{y}-y)=2({w}_{1}{x}^{2}+{w}_{2}x+b-y)$
$\frac{\partial loss}{\partial {w}_{1}}=\frac{\partial loss}{\partial \hat{y}}*\frac{\partial \hat{y}}{\partial {w}_{1}}=2r*{x}^{2}=2{x}^{2}({w}_{1}{x}^{2}+{w}_{2}x+b-y)$
$\frac{\partial loss}{\partial {w}_{2}}=\frac{\partial loss}{\partial \hat{y}}*\frac{\partial \hat{y}}{\partial {w}_{2}}=2r*{x}=2{x}({w}_{1}{x}^{2}+{w}_{2}x+b-y)$
$\frac{\partial loss}{\partial b}=\frac{\partial loss}{\partial \hat{y}}*\frac{\partial \hat{y}}{\partial b}=2r=2({w}_{1}{x}^{2}+{w}_{2}x+b-y)$

验证公式

计算模型 $\hat{y}={w}_{1}{x}^{2}+{w}_{2}x+b$ 中 损失对各权重的梯度。

import torch

x = 1.0
y = 2.0
w = torch.Tensor([1.0, 2.0])
b = torch.Tensor([2.0])
w.requires_grad = True
b.requires_grad = True

def forward(x):
    return w[0] * x ** 2 + w[1] * x + b

用公式计算

In[]:	w1_ = 2 * x ** 2 * (forward(x).item() - y)
		w2_ = 2 * x * (forward(x).item() - y)
		b_ = 2 * (forward(x).item() - y)
		w1_, w2_, b_
Out[]:	(6.0, 6.0, 6.0)

用 torch 计算梯度

In[]:	loss = (forward(x) - y) ** 2
		loss.backward()
		w.grad[0].item(), w.grad[1].item(), b.grad.item()
Out[]:	(6.0, 6.0, 6.0)

结果正确

结尾

以上就是我要分享的内容，因为学识尚浅，会有不足，还请各位大佬指正。
有什么问题也可在评论区留言。
在这里插入图片描述

白御空

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
反向传播（BP）

反向传播（BP）创作背景知识补充流程图公式验证公式结尾创作背景最近要学学反向传播（BP），写篇博客记录一下。知识补充误差反向传播，简称BP（Back Propagation）。机器学习过程可分为正向传播和反向传播。正向传播：输入信息从输入层经隐层处理，传至输出层。每层神经元（节点）的状态只影响下一层神经元的状态。反向传播：将误差信号沿原来通路返回，修改各层权重值，使误差信号最小，得到最佳（较佳）参数。流程图首先画一下流程图（用 mermaid 画出来效果看着不行，
复制链接

扫一扫

专栏目录