问题引入
卷积神经网络的二维卷积和三维卷积是在CNN中常用的操作,那么这两个类型的操作有什么区别呢?
问题解答
- 二维卷积 二维卷积操作如图5.3所示,为了更直观的说明,分别展示在单通道和多通道输入中,对单个通道输出的卷积操作。在单通道输入的情况下,若输入卷积核尺寸为
,卷积核在输入图像的空间维度上进行滑窗操作,每次滑窗和
窗口内的值进行卷积操作,得到输出图像中的一个值。在多通道输入的情况下,假定输入图像特征通道数为3,卷积核尺寸则为
,每次滑窗与3个通道上的
窗口内的所有值进行卷积操作,得到输出图像中的一个值。
![9e487f645ce419ee38c648bef6e536ce.png](https://i-blog.csdnimg.cn/blog_migrate/e1072d03c94dc373b583eba2fa7b11fc.jpeg)
- 三维卷积 3D卷积操作如图所示,同样分为单通道和多通道,且假定只使用1个卷积核,即输出图像仅有一个通道。对于单通道输入,与2D卷积不同之处在于,输入图像多了一个深度(depth)维度,卷积核也多了一个
维度,因此3D卷积核的尺寸为
,每次滑窗与
窗口内的值进行相关操作,得到输出3D图像中的一个值。对于多通道输入,则与2D卷积的操作一样,每次滑窗与3个channels上的
窗口内的所有值进行相关操作,得到输出3D图像中的一个值。
![781854a8466dc920033229a91a331842.png](https://i-blog.csdnimg.cn/blog_migrate/b68947e4830da92156260e8460cc7463.jpeg)
欢迎关注我的公众号,第一时间追踪相关面试题和总结:百面机器学习。回复干货获取相关资料和面试题总结(定期更新)。
![eedd4d50df833816074db5f086327dc1.png](https://i-blog.csdnimg.cn/blog_migrate/fe5cbf8e2af74ee51d1136c7dcc531ed.jpeg)