通俗易懂的卷积神经网络教程-第二讲

最新推荐文章于 2024-09-23 11:09:22 发布

小木希望学园

最新推荐文章于 2024-09-23 11:09:22 发布

阅读量2k

点赞数 4

分类专栏：深度学习通俗易懂的卷积神经网络教程

本文链接：https://blog.csdn.net/u013631121/article/details/80286691

版权

深度学习同时被 2 个专栏收录

8 篇文章 3 订阅

订阅专栏

通俗易懂的卷积神经网络教程

7 篇文章 35 订阅

订阅专栏

先回忆第一讲的内容

我们通过把图片数字化，变成一个个的小点，再把小点点给拉成一行，变成自变量。然后我们把图片中的数字作为标签，也就是因变量，我们设定一张图片有10个因变量，这十个变量值是0或1的数字，如果是某位置x是1，那么这个图片中的数字就是x-1。

如果有6W张图，我们会得到6W组这样的变量，这样的变量就是我们输入到卷积神经网络中的输入变量。最后我们会得到一个自变量、标签的表格：

表1

自变量1	X_1,1	X_1,2	...	X_1,784
自变量2	X_2,1	X_2,2	...	X_2,784
...	...	...	...	...
自变量6W	X_6W,1	X_6W,2	...	X_6W,784

表中，X_a,b指的是第a张图中的第b个自变量。

表2

标签1	Y_1,1	Y_1,2	...	Y_1,10
标签2	Y_2,1	Y_2,2	...	Y_2,10
...	...	...	...	...
标签6W	Y_6W,1	Y_6W,2	...	Y_6W,10

表中，Y_a,b指的是第a张图中的第b个标签。

我们把这些数据带入到CNN中，就可以开始正向传播了。正向传播分为三个步骤，第一个步骤是卷积、第二步骤是池化、第三步骤是BP网络全连接。前两部也可以分为多步来解决问题，如：“输入数据->卷积1-->池化1->卷积2-->池化2->...->卷积n->池化n->BP网络->输出数据”的形式。

那么我先说一下怎么卷积，我们导入了表1和表2两组数据。首先我们来搞表1：

（1）我们选取表1中的一行，然后把这行的数据还原成28*28的一个矩阵：

有人会说，刚才给拉成一行了，这回又还原了是不是傻啊，脱裤子放屁多此一举嘛！你说的对，确实多此一举。但是你既然能够想到这一点，就说明你第一讲的内容掌握的不错，也就是说我写得文章你看懂了，说明我的讲解奏效了。其实它还有一个作用，我们图片输入进去是一个个的变量，6W组图片就6W组变量，东西太乱了，如果给拉成一行，然后所有数据合并成一组变量，也就是表1，那么看起来是不是也很简洁呢？

（2）还原之后呢，我们随机生成6组滤波器矩阵，每一个矩阵是一个5*5的矩形表格，每一个表格里面都有一个数据，这些数据是随机生成的的值wij。每个滤波器我们在设定一个偏置量值bk，6组就一共有6个偏置量。

（3）然后我们用刚刚从表1拿出来的第一组自变量与第一个滤波器做卷积运算。这个与我们第一节讲的卷积有些不同，我们不再最前面添加0，而是直接从第一个小点开始，我们把5*5的滤波器与自变量矩阵最前面的五行五列对齐，也就是把滤波器放到红色的位置：

（4）之后我们把自变量小格和滤波器对应的位置相乘，如第一个小格与滤波器的第一个值就乘积是X1*W11，第二个乘积就是X2*W12，以此类推，最后一个乘积就是X117*H55。我们得到了25个乘积值，然后我们把乘积给加和,并加上偏置量b1求出D1,1=X1*W11+X2*W12+...+X117*H55+b1。