卷积神经网络CNN解析-针对斯坦福的深度学习教程

最新推荐文章于 2022-08-27 19:58:36 发布

JuracyKacha

最新推荐文章于 2022-08-27 19:58:36 发布

阅读量2.3k

点赞数

分类专栏：机器学习理论入门

本文链接：https://blog.csdn.net/JuracyKacha/article/details/52973057

版权

机器学习理论入门专栏收录该内容

1 篇文章 0 订阅

订阅专栏

附上针对的实验：http://ufldl.stanford.edu/tutorial/supervised/ExerciseConvolutionalNeuralNetwork/

这里就不陈述卷积网络的意义了，就直接陈述怎么做，怎么写前向传播和反向传播，求各个参数的倒数。

阅读前建议读者对于全连接网络有着透彻的理解。。没有的话，强烈建议看看上述实验前面的全连接部分的练习。

建议读者配合着实验的英文论述再看这篇。。会好的多。

实验构造的是单个卷积-池化层------全连接网络--------输出的结构，就是一层CNN连接一层NN的结构。

以实验中的debug部分作为解析吧，实际运行时就改卷积核个数numFilters，和卷积尺度filterDim还有poolDim就可以了。

debug部分采用两个卷积核，对应两个池化层，然后池化层全连接输出单元。

来一个结构图解：嗯对的图很重要！这个乱七八糟的图是我自己画的，之后的图截取自实验教程。

从底层开始讲吧，最底层是输入层，在实验中对应那个28*28的原始输入图像。

卷积操作：卷积核使用9*9的尺寸，于是在卷积1,2中的图形是20*20的尺寸。

卷积层的输出定义为 activations=cnnConvolve(filterDim, numFilters, images, Wc, bc)

这里用图片举个例子，卷积特征的4来自于卷积核（橙色的方块）参数乘以对应的覆盖于然后求和出的结果，然后将卷积核在图像中逐个像素移动，得到对应的卷积后的特征图。然后对于卷积后的图像的每一个元素执行sigmoid函数，将每一个元素转化为[0,1]区间内的特征。

Tip: matlab中有一个很方便的函数用来做卷积叫做conv2。

池化操作：其实这就是一个取平均的操作，针对之前20*20的卷积特征图，池化层过滤器尺寸为5*5，则池化层输出为4*4的图像。还有别的池化操作，比如最大值等。。

池化层的输出定义为activationsPooled=cnnPool(poolDim, activations)

如图所示，池化层的1是卷积层的所有红色覆盖元素值的平均值。

最后对于池化层，全连接输出层。

全连接层的输出定义为probs。

以上结构中有需要学习参数的部分，只有卷积核参数W1,W2，还有全连接参数Theta。

反向传播：

计算误差：

这里是我认为的难点，一方面是确实难，另一方面实验教程的变量意义还注释的确实很不明白。。。。。

输出层误差：delta_output=probs-label_vec，就是预测值减去实际标签值，这里的预测值和标签值都是向量化的，比如10，表示为(0,0,0,0,0,0,0,0,0,1)。

池化层误差：delta_pool=Theta'*delta_output，等于Theta的转置乘以delta_output。

卷积层误差：delta_filter=zeros(convDim,convDim,numFilters,numImages);计算每一张图像对于每一个卷积层的误差，所以是一个四维数组。

for j=1:numFilters
for i=1:numImages
delta_filter(:,:,j,i)=(1/poolDim^2)*kron(delta_pool(:,:,j,i), ones(poolDim)).*activations(:,:,j,i) .*(1 - activations(:,:,j,i));
end
end

这里有一个kron函数，它的意义是将一个矩阵等值扩张，将1,2,3,4矩阵扩张成左边那个矩阵的样子。这么做的是因为之前池化操作是对于卷积层的均值化嘛。

还有就是矩阵的.*意思是每一个元素相乘。

计算导数：

1，对于全连接层Theta：

它的数学公式长这样，嗯很抽象。。。。。

翻译成代码就是：Theta_grad = delta_output*activationsPooled'/numImages;
Theta_b_grad = sum(delta_output,2)/numImages;

2，对于卷积层的倒数Wc_grad和bd_grad：

英文论述：。。。。

对于英文不是很给力的我简直。。。看着这想死。。。意思就是用卷积层误差，去卷积操作原始图像，得到的结果再对于图片数量取平均。

还是翻译成代码吧。。。。

for j=1:numFilters
for i=1:numImages
pic=images(:,:,i);
delta=rot90(delta_filter(:,:,j,i),2);
bc_grad(j)=bc_grad(j)+sum(delta(:));
Wc_grad(:,:,j) = Wc_grad(:,:,j)+conv2(pic,delta,'valid');
end
end
Wc_grad=Wc_grad/numImages;
bc_grad=bc_grad/numImages;

到这里应该接下来就很简单了，获得了每个参数的导数之后，揉成单维向量，传进梯度下降函数中，调整每个参数的数值，嗯一个简易的卷积神经网络就完成喽。

JuracyKacha

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络CNN解析-针对斯坦福的深度学习教程

附上针对的实验：http://ufldl.stanford.edu/tutorial/supervised/ExerciseConvolutionalNeuralNetwork/这里就不陈述卷积网络的意义了，就直接陈述怎么做，怎么写前向传播和反向传播，求各个参数的倒数。阅读前建议读者对于全连接网络有着透彻的理解。。没有的话，强烈建议看看上述实验前面的全连接部分的练习。建议读者配合着实验
复制链接

扫一扫