链式法则及反向传播算法

最新推荐文章于 2024-02-27 10:51:38 发布

哈工程第一亚索

最新推荐文章于 2024-02-27 10:51:38 发布

阅读量835

点赞数

分类专栏： tensorflow 文章标签：算法机器学习深度学习

本文链接：https://blog.csdn.net/qq_46588746/article/details/120292650

版权

tensorflow 专栏收录该内容

37 篇文章 2 订阅

订阅专栏

链式法则及反向传播算法

1. 链式法则

链式法则即链式求导

2. 反向传播推导（多层多输出感知机）

在这里插入图片描述

简要推导(求和范围为 $k\in K$ ) $\frac{\partial E}{\partial w_{ij}}=\frac{\partial}{\partial w_{ij}}\frac{(O_k-t_k)^2}{2}$ $\frac{\partial E}{\partial w_{ij}}=\sum (O_k-t_k)\frac{\partial}{\partial w_{ij}}\sigma (x_k)$ $\frac{\partial E}{\partial w_{ij}}=\sum (O_k-t_k)\sigma (x_k)(1-\sigma(x_k))\frac{\partial x_k}{\partial w_{ij}}$ $\frac{\partial E}{\partial w_{ij}}=\sum (O_k-t_k)O_k(1-O_k)\frac{\partial x_k}{\partial O_j}\frac{\partial O_j}{\partial w_{ij}}$ $\frac{\partial E}{\partial w_{ij}}=\sum (O_k-t_k)O_k(1-O_k)W_{jk}\frac{\partial O_j}{\partial w_{ij}}$ $\frac{\partial E}{\partial w_{ij}}= O_j(1-O_j)\frac{\partial x_j}{\partial w_{ij}}\sum(O_k-t_k)O_k(1-O_k)W_{jk}$ $\frac{\partial E}{\partial w_{ij}}= O_j(1-O_j)O_i\sum(O_k-t_k)O_k(1-O_k)W_{jk}$ 另 $(O_k-t_k)O_k(1-O_k)=\sigma_k$ ，上式可化为 $\frac{\partial E}{\partial w_{ij}}= O_j(1-O_j)O_i\sum \sigma_kW_{jk}$

3. 2D函数优化（反向传播算法）实现

import numpy as np
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import pyplot as plt
import tensorflow as tf

def DBG(x):
    return (x[0] ** 2 +x[1] - 11) ** 2 + (x[0] + x[1] ** 2 - 7) ** 2


x = np.arange(-6, 6, 0.1)
y = np.arange(-6, 6, 0.1)
X, Y = np.meshgrid(x, y)
Z = DBG([X, Y])
fig = plt.figure('DBG')
ax = fig.gca(projection='3d')
ax.plot_surface(X, Y, Z)
ax.view_init(60, -30)
ax.set_xlabel('x')
ax.set_xlabel('y')
plt.show()

# 设置初始点
x = tf.constant([3., 0.])
for step in range(150):
    with tf.GradientTape() as tape:
        tape.watch([x])
        y = DBG(x)
    # 加[0]避免出现“无法将序列与“float”类型的非int相乘”问题
    grads = tape.gradient(y, [x])[0]
    x -= 0.01*grads
    if step % 20 == 0:
        print('step{}:   x={}   f(x)={}'.format(step, x.numpy(), y.numpy()))

哈工程第一亚索

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
链式法则及反向传播算法

链式法则及反向传播算法目录链式法则及反向传播算法1. 链式法则2. 反向传播推导（多层多输出感知机）3. 2D函数优化（反向传播算法）实现1. 链式法则链式法则即链式求导2. 反向传播推导（多层多输出感知机）简要推导(求和范围为k∈Kk\in Kk∈K)∂E∂wij=∂∂wij(Ok−tk)22\frac{\partial E}{\partial w_{ij}}=\frac{\partial}{\partial w_{ij}}\frac{(O_k-t_k)^2}{2}∂wij∂E=∂w
复制链接

扫一扫

专栏目录