反向传播精讲

最新推荐文章于 2024-05-01 13:04:16 发布

滑动窗口协议

最新推荐文章于 2024-05-01 13:04:16 发布

阅读量240

点赞数

分类专栏： DeepLearning 算法基础文章标签：深度学习 cnn 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42184557/article/details/125432631

版权

DeepLearning 算法基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

神经网络由layer级联而成
每个layer的正向运算过程都有清晰的定义。它们或包含有学习能力的参数，或纯粹包含运算逻辑
所有基础的Layer都归属于以下三种：

卷积
全连接，其实，全连接从计算的角度上看就是特殊的卷积。m $\rightarrow$ n的全连接层其实是：包含n个1 $*$ 1 $*$ m的卷积核的卷积层
激活
池化

通常来说，卷积、激活、池化中的卷积和激活包含可学习的参数，池化只包含纯粹的运算逻辑；

神经网络的训练其实就是所有层中可学习的参数的更新。（网络是不是可以自己判断效果自己增长呢？）在每个batch后会更新所有的参数。

介绍一下网络参数更新的原理：
一旦定义了Loss Function，每个参数就都有了负梯度方向，为什么参数是按组更新呢？比如说卷积核的更新就是同时更新所有的核，这是实现过程的一种选择，为什么不逐个更新核中的参数呢，因为逐个更新使用的方向和同时更新使用的方向是一致的，核中不同位置的参数又是相互正交的，在同一个batch中进行更新，逐个更新一个卷积核中的参数和同时更新该卷积核中所有参数得到的结果是一样的。

那么向负梯度方向走多长呢？走的长度和Loss、以及学习率lr的设置有关

OK，现在开始本文最重要的内容，如何获得负梯度方向。
通过真实的数学推导可以看到，梯度是可以随着运算传递的。

滑动窗口协议

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
反向传播精讲

反向传播精华
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。