BP反向传播矩阵推导图示详解

最新推荐文章于 2024-07-08 17:03:29 发布

PaperWeekly

最新推荐文章于 2024-07-08 17:03:29 发布

阅读量746

点赞数

文章标签：神经网络机器学习人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/112300469

版权

本文深入探讨了BP（反向传播）算法，从矩阵的角度详细推导了无激活函数和含激活函数的4层及L层神经网络的BP原理，借助示意图辅助理解。通过预备知识介绍了矩阵求导，并验证了吴恩达机器学习讲义中BP矩阵推导的正确性。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者｜孙裕道

学校｜北京邮电大学博士生

研究方向｜GAN图像生成、情绪对抗样本生成

背景介绍

BP（反向传播）是有 Geffrey Hinton 在 1988 年发表的论文《Learning representations by back-propagating errors》中首次被提出来。

该论文从题目到内容到参考文献一共 2 页半，Hinton 也借此工作荣获 2018 年的图领奖。在深度学习领域，BP 的重要程度在怎么强调也不为过，本文会从矩阵的视角对 BP 进行详细推导，为了更好地理解 BP 的工作原理，本文也画了大量的示意图帮助理解。

本文的公式经过自己很多次的推导打磨，尽力做到准确无误，每一张图也是反复的捉摸力求精准表达。本文的阅读难度确实很大，但是因为其重要，我觉得反复抄写下面的推导，也会有很多收获。

引言

在吴恩达的斯坦福机器学习的讲义中关于 BP 原理的介绍只给出了最后的 BP 矩阵的推导结果，略去了中间的推导过程。本文会对略去的推导过程进行补全。为了减少阅读阻碍，BP 矩阵证明过程会从预备知识开始慢慢铺展开来，其中最难啃的部分就是矩阵形式的链式法则。本文文章结构和的各个章节的内容如下：

p 3 是一些预备知识介绍了矩阵求导的细节，如果想要看懂之后的 BP 矩阵推导这部分的两个小节一定要看明白
p 4 是关于 4 层无激活函数的 BP 推导细节
p 5 是关于 L 层无激活函数的 BP 推导细节
p 6 是关于 4 层含激活函数的 BP 推导细节
p 7 是关于 L 层含激活函数的 BP 推导细节
p 8 是对吴恩达机器学习讲义中关于 BP 章节结果的验证

预备知识

3.1 推导形式1

已知，是标量即，，，，，表示向量的 2 范数，将矩阵中各个维度带入到公式（1）有如下形式：

令，。则对矩阵的链式法则的求导公式如下所示：

其中，，直观可以发现等式（3）左右两边的雅可比矩阵维度一致。对矩阵的链式法则的求导公式如下所示：

其中，，等式（4）左右两边的雅可比矩阵维度一致。

3.2 推导形式2

是激活函数，是标量即，，，，

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。