HongYiLee Backpropagation Notes

最新推荐文章于 2024-06-26 11:09:03 发布

LuoDeng008

最新推荐文章于 2024-06-26 11:09:03 发布

阅读量200

点赞数

文章标签： Notes Backpropagation DeepLearning

本文链接：https://blog.csdn.net/weixin_39457086/article/details/80984023

版权

HongYiLee Backpropagation Notes

标签： Notes DeepLearning Backpropagation

Introduction of Deep Learning

1. Given a network structure, mean we define the function set.

给定一个神经网络的结构，那么就是定义了一个函数集合。然后我们要做的就是去找到一个最好的best function。

What does a Nerual network do?

y = f (x) = σ (W L . . . σ (W 2 (σ (W 1 + b 1) + b 2) + . . . + b L)

$y = f(x)=\sigma(W^L...\sigma(W^2(\sigma(W^1+b^1)+b^2)+...+b^L)$
So we can using parallel computing techniques to speed up matrix operation.
对于矩阵运算，我们可以使用 GPU的加速运算能力。

2. Define the goodness or badness of a function. We call it Loss Function.

3. Pick the function minimize the Loss Function.

Backpropagation反向传播

L (θ) = \sum n = 1 N l n (θ)

$L(\theta)=\sum_{n=1}^{N}l^n(\theta)$

\partial L ( θ ) \partial w = \sum n = 1 N \partial l ( θ ) \partial w

$\frac{\partial L(\theta)}{\partial w} = \sum_{n=1}^{N}\frac{\partial l(\theta)}{\partial w}$
So we need just to compute

∂l(θ)∂w ∂ l ( θ ) ∂ w $\frac{\partial l(\theta)}{\partial w}$ .

\partial l ( θ ) \partial w = \partial l ( θ ) \partial z \partial z \partial w

$\frac{\partial l(\theta)}{\partial w} = \frac{\partial l(\theta)}{\partial z}\frac{\partial z}{\partial w}$
So we have Forward pass:compute

∂z∂w ∂ z ∂ w $\frac{\partial z}{\partial w}$ .
and Backward pass: compute

∂l(θ)∂z ∂ l ( θ ) ∂ z $\frac{\partial l(\theta)}{\partial z}$ .

Forward pass:
$\partial z \partial w 1 = x 1$ $\frac{\partial z}{\partial w_1}=x_1$
$\partial z \partial w 2 = x 2$ $\frac{\partial z}{\partial w_2}=x_2$
$. . .$ $...$
$\partial z \partial w i = x i$ $\frac{\partial z}{\partial w_i}=x_i$
Backward pass:
Let $a=\sigma(z)$ , $\partial l \partial z = \partial a \partial z \partial l \partial a$ $\frac{\partial l}{\partial z}=\frac{\partial a}{\partial z}\frac{\partial l}{\partial a}$
$\partial a \partial z = σ' (z)$ $\frac{\partial a}{\partial z}=\sigma^{'}(z)$
$\partial l \partial a = \partial z ' \partial a \partial l \partial z ' + \partial z '' \partial a \partial l \partial z ''$ $\frac{\partial l}{\partial a} = \frac{\partial z^{'}}{\partial a}\frac{\partial l}{\partial z^{'}} +\frac{\partial z^{''}}{\partial a}\frac{\partial l}{\partial z^{''}}$ So this is Chain Rule.

LuoDeng008

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HongYiLee Backpropagation Notes

HongYiLee Backpropagation Notes标签： Notes DeepLearning BackpropagationIntroduction of Deep Learning1. Given a network structure, mean we define the function set.给定一个神经网络的结构，那么就是定义了一个函数集合。然后...
复制链接

扫一扫