最近在看《深度学习之美:AI时代的数据处理与最佳实践》发现对于卷积核深度的理解有点混淆。
于是又看了《TensorFlow:实战Google深度学习框架(第2版)》,分清了卷积核输入深度和输出深度。
但是,对于如何把3×3×3的矩阵卷积到3×3×6 ? 终于在《动手学深度学习》中搞懂了!
(1)首先对于灰度图片进行卷积,即二维矩阵,卷积即对应位置元素相乘再相加,如下图:
(2)如果图片是彩色的,那么我们输入三维矩阵,每一维都要有对应的卷积核,在逐维卷积后,对应元素相加,便得到最终的输出矩阵。如下图:
(3)经过上述操作,我们卷积后的得到的矩阵还是二维的,即一个平面。那么如果我们需要挖掘更深层次的特征,是不是可以把操作(2)多重复几次,也就是使用不同的卷积核 / 过滤器进行多次卷积,这样便会生成多个特征矩阵。卷积核个数也就是我们说的卷积核输出深度,而图片的第三位通道数则为卷积核输入深度,和卷积核的宽、高统称为卷积核的尺寸,卷积过程见下图:
注:这里为了作图方便,n个卷积核内容都一样,所以输出的特征矩阵也一样,实际会用不同的卷积核构造输出深度。
今天看了篇新资料,里面卷积讲的挺好的,引用如下:
【一文读懂Faster RCNN】
猜你喜欢:👇🏻
⭐【随笔】深度学习之美——杨家有女初长成,养在深闺人未识
⭐【随笔】激活函数是怎样一种存在?