GCN的反向传播推导

最新推荐文章于 2023-12-18 21:36:23 发布

Show Me The Money

最新推荐文章于 2023-12-18 21:36:23 发布

阅读量3.1k

点赞数 3

分类专栏：机器学习再识别文章标签：深度学习机器学习数据挖掘

本文链接：https://blog.csdn.net/qq_38156298/article/details/105148492

版权

机器学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

再识别

4 篇文章 0 订阅

订阅专栏

GCN的反向传播

1.预备知识

随机梯度下降法根据以下公式更新梯度
$\theta_{t+1}=\theta_{t}-\alpha\frac{1}{K}\sum_{(x,y)\in \delta_t}\frac{\partial L(y,f(x;\theta))}{\partial \theta} \qquad (1)$
同样的，如果要更新网络中的W，那么就要计算
$W_{t+1}=W_{t}-\alpha\frac{1}{K}\sum_{(x,y)\in \delta_t}\frac{\partial L(y,f(x;W))}{\partial W}$
关键是计算其中的 $\frac{\partial L}{\partial W}$ ，而 $\frac{\partial L}{\partial W}=\frac{\partial L}{\partial z}\frac{\partial z}{\partial W}$ (其中 $z$ 是网络神经元的输出)，把第一项 $\frac{\partial L}{\partial z}$

定义为误差 $\delta$ ，那么就可以先求出误差，然后再求第二项 $\frac{\partial z}{\partial W}$ ，再根据 $(1)$ 更新参数。

整个流程大致为：
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保失败,源站可能有防盗链机制,建议将图片保存下来直接上传存下来(img-z3qOlS4n-1585308262098)(C:\Users\a\AppData\Roaming\Typora\typora-user-images\image-20200327182408276.png)(C:\Users\a\AppData\Roaming\Typora\typora-user-images\image-20200327182408276.png)]$

GCN的反向传播

GCN的前向传播为：
$Z^{l+1}=PH^lW^l,\qquad H^{l+1}=\sigma(z^{l+1})$
那么根据以上流程，前馈计算每一层的净输入 $z^l$ 和激活值 $a^l$ ，直到最后一层；然后计算每一层的误差 $\delta^l$ :
$\delta^l=\frac{\partial L}{\partial Z^l}=\frac{\partial L}{\partial H^l}\frac{\partial H^l}{\partial Z^l}=\frac{\partial L}{\partial Z^{l+1}}\frac{\partial Z^{l+1}}{\partial H^l}\frac{\partial H^l}{\partial Z^l} \qquad (2)$
又因为
$Z^{l+1}=PH^lW^l, \qquad H^{l}=\sigma(Z^{l})$
所以 $(2)$ 式为
$\delta^l=\delta^{l+1}P^TW^l\sigma'(Z^l)$
得到误差传播公式以后，根据流程，计算参数的导数 $\frac{\partial L}{\partial W^l}=\frac{\partial L}{\partial Z^{l+1}}\frac{\partial Z^{l+1}}{\partial W^l}=\delta^{l+1} \frac{\partial Z^{l+1}}{\partial W^l}$ ，所以现在只要计算 $\frac{\partial Z^{l+1}}{\partial W^l}$
$\frac{\partial Z^{l+1}}{\partial W^l}=\frac{\partial (PH^{l}W^{l})}{\partial W^l}=(PH^l)^T \qquad (3)$
然后根据求得的参数导数和式(1)更新参数，直到模型错误率不再下降。

式 $(3)$ 证明了，每次计算第 $l$ 层的梯度都要使用到前一层邻居节点的特征。如图 $[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RJpWO2Sc-1585308262122)(C:\Users\a\AppData\Roaming\Typora\typora-user-images\image-20200327184906204.png)]$

所以随着网络层数的增加，感受野越大，计算复杂度也越大。

Show Me The Money

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
3
评论
GCN的反向传播推导

GCN的反向传播我特么终于推出来了！！！1.预备知识随机梯度下降法根据以下公式更新梯度θt+1=θt−α1K∑(x,y)∈δt∂L(y,f(x;θ))∂θ(1)\theta_{t+1}=\theta_{t}-\alpha\frac{1}{K}\sum_{(x,y)\in \delta_t}\frac{\partial L(y,f(x;\theta))}{\partial \theta} ...
复制链接

扫一扫

专栏目录