卷积神经网络的参数

最新推荐文章于 2024-09-18 13:42:50 发布

Thebluewinds

最新推荐文章于 2024-09-18 13:42:50 发布

阅读量4.5k

点赞数 3

分类专栏：卷积神经网络文章标签：深度学习机器学习神经网络

本文链接：https://blog.csdn.net/Thebluewinds/article/details/117367305

版权

卷积神经网络专栏收录该内容

2 篇文章 3 订阅

订阅专栏

本文详细讲解了卷积神经网络中所需的参数，包括卷积层过滤器、偏置和输出层权重。重点阐述了神经单元误差δjl在表示参数梯度分量的应用，以及输出层误差的计算方法。利用误差方向传播法简化计算，展示了梯度下降法在参数更新中的核心公式。

摘要由CSDN通过智能技术生成

误差方向传播法师为了应对偏导数计算量巨大而提出。但是梯度下降法仍然是基础。

一、卷积神经网络所需要的参数

卷积层的过滤器示例：
在这里插入图片描述
卷积层的统一偏置： $b^{F1}_{}$
输出层权重： $w_{1-11}^{O1}$
输出层偏置： $b_{1}^{O1}$
梯度下降法的基本公式： $\left( \varDelta w_{11}^{F1},\cdots ,\varDelta w_{1-11}^{O1},\cdots ,\varDelta b_{1}^{2}, \cdots \right) =\,\,-\eta \left( \frac{\partial C_T}{\partial w_{11}^{F1}},\cdots ,\frac{\partial C_T}{\partial w_{1-11}^{O1}},\cdots ,\frac{\partial C_T}{\partial b^{F1}},\cdots ,\frac{\partial C_T}{\partial b_{1}^{O}},\cdots \right)$

二、用神经单元误差 $\delta _{j}^{l}$ 来表示各参数梯度分量

1、输出层的误差
$\frac{\partial C}{\partial w_{k-ij}^{O_n}}=\delta _{ij}^{O}a_{ij}^{Pk}, \frac{\partial C}{\partial b_{n}^{O}}\,\,=\,\,\delta _{n}^{O}$

其中n为输出层的神经单元标号，k为池化层的子层编号，i、j为过滤器的行、列编号。第一个：表示输出层第n个神经元的第k层池化层的i-j输出神经元的权重的神经单元误差。第二个：第n个神经元的偏置的神经单元误差
2、卷积层的误差
A、卷积层过滤器权重
$\frac{\partial C}{\partial w_{ij}^{F_k}}\,\,=\,\,\delta _{11}^{F_k}x_{ij}+\,\,\delta _{12}^{F_k}x_{ij+1}+\cdots +\,\,\delta _{44}^{F_k}x_{i+3j+3}$
这是像素数为6x6、过滤器为3x3的关系式。其他情况下，需要根据实际情况进行相应的改变。表示第k层卷积层的第i-j个神经单元误差。
B、卷积层统一的偏置权重
$\frac{\partial C}{\partial b_{}^{F_k}}=\,\,\delta _{11}^{F}+\delta _{12}^{F_k}+\cdots +\delta _{33}^{F_k}+\cdots +\delta _{44}^{F_k}$