CNN入门系列（1）——Input of CNN and Convolutional Layer

最新推荐文章于 2024-05-14 11:12:31 发布

bdyzhy9527

最新推荐文章于 2024-05-14 11:12:31 发布

阅读量610

点赞数 1

分类专栏： cnn 文章标签： cnn 计算机

本文链接：https://blog.csdn.net/bdyzhy9527/article/details/53469343

版权

本文是关于CNN入门的系列文章，基于cs231n课程内容。介绍了彩色图像（W*H*3矩阵）和灰度图像（W*H*1矩阵）如何作为CNN的输入，并详细讲解了卷积层的工作原理，包括卷积核的使用、特征映射和参数数量的关系。同时，定义了一些关键术语，如卷积核、步长和零填充等。

摘要由CSDN通过智能技术生成

参考：cs231n

这个系列写的是我对cs231n的一些翻译和理解

————————————————————————————————————————————

input of CNN

在刚接触CNN的时候，我是看到的几乎所有的教程都是已识别灰度图像入门的，灰度图像在计算机中的表示是一个二维的矩阵，每个(x. y)对应一个值在[0， 255]之间的数字。但是彩色图像应该怎么作为输入呢？

举个例子：

灰色图像:
 [101, 102, 103...
   111, 112, 113...]

彩色图像:
[[101, 102, 103], [104, 105, 106]...
[111, 112, 113], [114, 115, 116]...]

上面这张图是cs231n里给的可视化图片，简单说下图片下面的英文：神经卷积网络的每层通过一个神经元将一个3D输入卷转化为3D输出卷。在这个例子里，红色层（最左边那一层）储存输入图片，所以他的宽度和高度是图片的尺寸，深度是3（RGB三种颜色）。
也就是说我们输入的彩色图片是一个W*H*3的矩阵，灰色图片是W*H*1的矩阵。