P19 PyTorch 链式法则

最新推荐文章于 2024-06-19 18:17:21 发布

明朝百晓生

最新推荐文章于 2024-06-19 18:17:21 发布

阅读量129

点赞数

分类专栏：人工智能文章标签：神经网络人工智能深度学习 Powered by 金山文档

4AM_明朝百晓生

本文链接：https://blog.csdn.net/chengxf2/article/details/129143926

版权

人工智能专栏收录该内容

102 篇文章 3 订阅

订阅专栏

文章首先回顾了感知机模型，它是最简单的单层神经网络，使用sigmoid激活函数。接着介绍了在深度学习中常用的导数方程，包括链式法则的应用。通过一个例子展示了如何利用PyTorch的autograd模块进行梯度计算，解释了如何通过链式法则求得深层网络中参数的梯度。

摘要由CSDN通过智能技术生成

前言：

链式法则是深度学习中比较基础核心的一部分，

这里先简单的回顾一下感知机模型，然后常用的导数方程，以及

链式求导法则

一感知机

简单回顾一下前面感知机模型，这是一种最简单的单层网络结构

输入

$\text{[math]}$

前向传播

$\text{[math]}$

输出

$\text{[math]}$

, 这里面用的是sigmod函数作为激活函数输出

损失函数

$\text{[math]}$

则

$\text{[math]}$

整个梯度可以看作两个部分，一部分只跟输出有关系，另一部分跟输入有关系

二常用导数方程

2.1 $\text{[math]}$

2.2 $\text{[math]}$

2.3 $\text{[math]}$

2.4 $\text{[math]}$

2.5 f*g= $\text{[math]}$

2.6 $\text{[math]}$

2.7 $\text{[math]}$

2.8 假设向量之间的依赖关系为 $\text{[math]}$ (x,y,z 都是向量）

$\text{[math]}$

2.9 假设向量之间的依赖关系为 $\text{[math]}$ (其中 x,y 为m,n的向量，z为标量)

$\text{[math]}$

三例子

# -*- coding: utf-8 -*-
"""
Created on Tue Feb 21 16:40:49 2023

@author: chengxf2
"""

import torch

import torch.autograd  as autograd

def grad():
    
    x = torch.tensor(1.0)
    w1 = torch.tensor(2.3, requires_grad= True)
    b1 = torch.tensor(1.0)
    
    w2 = torch.tensor(3.3, requires_grad= True)
    b2 = torch.tensor(1.0)
    
    y1 = w1*x+b1
    y2 = w2*y1+b2
    
    dy2_dy1 =autograd.grad(y2, [y1], retain_graph=True)
    dy1_dw1 = autograd.grad(y1, [w1], retain_graph=True)
    dy2_dw1 = autograd.grad(y2, [w1], retain_graph = True)
    
   
    
    a = dy1_dw1[0]*dy2_dy1[0]
    
    print("\n 本地计算 ",a ,"\t API  函数计算",dy2_dw1)
    
if __name__ == "__main__":
    
    grad()