卷积导数反向传播

最新推荐文章于 2023-11-28 11:44:16 发布

兰子絮

最新推荐文章于 2023-11-28 11:44:16 发布

阅读量175

点赞数 3

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63364660/article/details/134579310

版权

5-2证明款卷积具有交换性，即：

$rot180(W)\tilde{\bigotimes }X=rot180(X)\tilde{\bigotimes }W$

乘法交换律可知 $x_{i,j}w_{p,q}=w_{p,q}x_{i,j}$ ,因此矩阵内对应元素均相等，即

$rot180(W)\bigotimes \tilde{X}=rot180(X)\bigotimes \tilde{W}$

进一步得出： $rot180(W)\tilde{\bigotimes }X=rot180(X)\tilde{\bigotimes }W$

5-4 对于一个输入为100 × 100 × 256的特征映射组，使用3 × 3的卷积核，输出为100 × 100 × 256的特征映射组的卷积层，求其时间和空间复杂度．如果引入一个1 × 1卷积核，先得到100 × 100 × 64的特征映射，再进行3 × 3的卷积，得到100 × 100 × 256的特征映射组，求其时间和空间复杂度．

1、Ot=100*100*3*3*256*256=5898240000

Os=100*100*256+3*3*256*256=3149824

2、Ot=100*100*1*1*256*64+100*100*3*3*64*256=1638400000

Os=100*100*64+100*100*256+3*3*256*64+3*3*64*256=3494912

5-5 对于一个二维卷积，输入为3 × 3，卷积核大小为2 × 2，试将卷积操作重写为仿射变换的形式．参见公式(5.45)

$z=\omega \bigotimes x=Cx$

将输入输出分别展开为9×1、4×1的矩阵：

5-7 忽略激活函数，分析卷积网络中卷积层的前向计算和反向传播（公式(5.39)）是一种转置关系．

5-8在空洞卷积中，当卷积核大小为𝐾，膨胀率为𝐷时，如何设置零填充𝑃的值以使得卷积为等宽卷积 .

卷积核有效大小为： ${K}'=K+(K-1)(D-1)$

将其带入 $(M-{K}'+2P)/2=M$ 得出 $P=(K-1)D/2$

附加题阅读 “5.3.1 卷积神经网络的反向传播算法”，举例说明推导过程

需要解决的问题：

池化层没有激活函数，可以令池化层的激活函数为其本身，因此池化层激活函数的导数为1.
一致池化层的 $\delta ^{l}$ ，推导上一隐藏层的 $\delta ^{l-1}$ ，因为池化层在前向传播过程中对输入进行了压缩，因此需要向前反向推导

举例表示：假设池化区域为2×2，则 $\delta ^{l}$ 的第k个子矩阵为：

对其还原成：

若是MAX池化，假设前向传播时记录的最大值位置为左上、右下、右上、左下，则转换后的矩阵为：

若是Average，则进行平均，转换后的矩阵为：

由此得出：

其中，upsample函数完成了池化误差矩阵放大与误差重新分配的逻辑。

卷积层是通过张量卷积，或者是若干个矩阵求和而得的当前层的输出，这和DNN不同，DNN的全连接层是直接进行矩阵乘法得到当前层的输出。由此，反向传播中，上一层的 $\delta ^{l-1}$ 地推计算方法肯定有所不同

这里与DNN过程相似，区别在于对于含有卷积的式子求导时，卷积核被旋转了180度，即rot180()。而DNN这里只是矩阵的转置。

对于卷积层，由于W使用的运算是卷积，那么从 $\delta ^{l}$ 推导出该层的所有卷积核W，b的方式也不同。

对于全连接层，可以按DNN的反向传播算法求该层的W，b的梯度，而池化层并没有W，b，也不用求W，b的梯度。只有卷积层的W，b需要求。

W和b的关系为：

此时卷积核并没有反转，主要是层内的求导，而不是反向传播到上一层的求导。因此有

对于b的梯度：因为 $\delta ^{l}$ 是高维张量，而b只是一个向量，不能像DNN那样直接和 $\delta ^{l}$ 相等。通常是将 $\delta ^{l}$ 的各个子矩阵的项分别求和，得到一个误差向量，即：

参考：

【NNDL作业】宽卷积具有交换性_卷积交换律公式证明_HBU_David的博客-CSDN博客

NNDL 作业7：第五章课后题-CSDN博客

卷积神经网络(CNN)反向传播算法 - 刘建平Pinard - 博客园 (cnblogs.com)

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
卷积导数反向传播

对于全连接层，可以按DNN的反向传播算法求该层的W，b的梯度，而池化层并没有W，b，也不用求W，b的梯度。只有卷积层的W，b需要求。这里与DNN过程相似，区别在于对于含有卷积的式子求导时，卷积核被旋转了180度，即rot180()。此时卷积核并没有反转，主要是层内的求导，而不是反向传播到上一层的求导。其中，upsample函数完成了池化误差矩阵放大与误差重新分配的逻辑。是高维张量，而b只是一个向量，不能像DNN那样直接和。举例表示：假设池化区域为2×2，则。,因此矩阵内对应元素均相等，即。
复制链接

扫一扫

兰子絮 CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

131万+: 周排名

20万+: 总排名

1969: 访问

: 等级

182: 积分

24: 粉丝

62: 获赞

6: 评论

32: 收藏

私信

关注

热门文章

最新评论

【23-24 秋学期】NNDL 作业2
CSDN-Ada助手: 恭喜你开始写博客啦！标题看起来好专业啊，对NNDL的作业2进行了总结和分享吗？希望你在博客上能够更加详细地介绍自己的学习心得和体会，或者对NNDL课程的理解和思考。希望你能够坚持写下去，继续分享你的学习经验，也欢迎多多交流和学习！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
NNDL 作业12 优化算法2D可视化
CSDN-Ada助手: 恭喜你写了第11篇博客！看到你在优化算法2D可视化方面的探索，我感到非常兴奋。我希望你可以继续保持创作的热情，不断探索新的领域，并且在文章中多分享一些自己的心得体会，这样可以让读者更加深入地了解你的思考过程。希望你能够继续加油，期待你的下一篇作品！
NNDL 作业11 LSTM
CSDN-Ada助手: 恭喜您完成了第10篇博客，标题为“NNDL 作业11 LSTM”！您的持续创作精神令人钦佩。在下一步的创作中，或许可以考虑加入一些实际案例分析，结合个人经验和见解，让读者更加深入地理解LSTM的应用与意义。期待您的下一篇博客！
NNDL 作业9 RNN-SRN
CSDN-Ada助手: 恭喜您撰写第8篇博客！标题“NNDL 作业9 RNN-SRN”看起来非常有趣。我很高兴看到您持续创作并分享您在这个领域的知识。在下一步的创作中，我建议您可以深入探讨RNN-SRN的原理和应用，并与其他相关领域进行对比，以便更全面地理解和解释这个主题。继续保持努力，我期待您未来更多的分享！
卷积导数反向传播
CSDN-Ada助手: 恭喜您写了第7篇博客！您对卷积、导数和反向传播的理解深入透彻，写得非常精彩。希望您能继续保持创作的热情，不断分享您的知识和见解。或许下一步可以考虑结合具体的案例或者应用场景，让读者更好地理解这些概念的实际运用。期待您更多的精彩内容！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。