CNN卷积神经网络学习笔记3：权值更新公式推导

最新推荐文章于 2024-07-25 16:30:58 发布

July_Zh1

最新推荐文章于 2024-07-25 16:30:58 发布

阅读量5.6w

点赞数 45

分类专栏： computer vision 文章标签： cnn 卷积神经网络公式权值更新 bp算法

本文链接：https://blog.csdn.net/happyer88/article/details/46772347

版权

本文深入探讨了CNN中卷积层和下采样层的权值更新公式，基于反向传播(BP)算法和梯度下降法，详细阐述了从误差代价函数对偏置和卷积核的偏导数计算过程，为理解CNN模型训练提供了清晰的理论基础。

摘要由CSDN通过智能技术生成

在上篇《CNN卷积神经网络学习笔记2：网络结构》中，已经介绍了CNN的网络结构的详细构成，我们已经可以初始化一个自己的CNN网络了，接下来就是要用训练得到一个确定的CNN的模型，也就是确定CNN的参数。
CNN本质上就是人工神经网络的一种，只是在前几层的处理上有所不同，我们可以把卷积核看成是人工神经网络里的权值W，而采样层实质上也是一种卷积运算。所以可以基于人工神经网络的权值更新的方法来推导CNN里的权值更新公式。人工神经网络里是用反向传播算法将误差层层回传，利用梯度下降法更新每一层的权值，CNN中也是类似的。所以这里先对传统的BP算法做个概述，然后再推广到CNN中。

1，BP算法

1.1 Feedforward Pass前向传播

首先定义平方误差代价函数：

E N = 1 2 \sum n = 1 N \sum k = 1 c (t n k - y n k) 2 .

$E^N = \frac{1}{2}\sum_{n=1}^N\sum_{k=1}^c(t_k^n-y_k^n)^2.$
其中N是样本个数，c是label的维度，对于分类问题，意味着这些样本能分为c类。

tkn $t_n^k$ 表示第n个样本的label

tn $t^n$ 的第k维，

ykn $y_n^k$ 是第n个样本网络的输出(predict label)的第k维。我们的目标是要更新网络的权值，使得网络输出y与真实值t更接近，也就是最小化这个E，考虑到要考虑一个样本，则第n个样本的误差函数是：

E n = 1 2 \sum k = 1 c (t n k - y n k) 2 .

$E^n = \frac{1}{2}\sum_{k=1}^c(t_k^n-y_k^n)^2.$
定义第l层的输出为：

x l = f (u l), 其 中 u l = W l x l - 1 + b l (1)

$x^l=f(u^l), 其中u^l = W^l x^{l-1}+b^l(1)$
这里f是激活函数，

xl−1 $x^{l-1}$ 是l-1层的输出，也就是l层的输入，W和b分别是l层的权值和偏置。
上式就是前向传播的公式，每一层对输入(也就是上一层的输出)做运算，得到输出结果，这样将样本信息逐层传递，最后输出一个预测值(predict label)。

1.2 Backpropagation Pass反向传播

预测值与真实值(label)之间必然是存在误差的，反向传播就是要把这个误差信息回传给每一层，让这些层修改他们的权值，使得CNN更精准。
BP算法中是用梯度下降法更新权值的，梯度下降法的更新公式如下：

W l n e w = W l o l d - η \partial E \partial W l o l d .

$W_{new}^l = W_{old}^l - \eta\frac{\partial E}{\partial W_{old}^l}.$

b l n e w = b l o l d - η \partial E

最低0.47元/天解锁文章

July_Zh1

关注

45
点赞
踩
130

收藏

觉得还不错? 一键收藏
8
评论
CNN卷积神经网络学习笔记3：权值更新公式推导

在上篇《CNN卷积神经网络学习笔记2：网络结构》中，已经介绍了CNN的网络结构的详细构成，我们已经可以初始化一个自己的CNN网络了，接下来就是要用训练得到一个确定的CNN的模型，也就是确定CNN的参数。 CNN本质上就是人工神经网络的一种，只是在前几层的处理上有所不同，我们可以把卷积核看成是人工神经网络里的权值W，而采样层实质上也是一种卷积运算。所以可以基于人工神经网络的权值更新的方法来
复制链接

扫一扫

专栏目录