CNN 学习总结笔记：

最新推荐文章于 2021-09-27 20:29:21 发布

FulChou

最新推荐文章于 2021-09-27 20:29:21 发布

阅读量121

点赞数 1

分类专栏：算法工程师笔记

本文链接：https://blog.csdn.net/qq_43213352/article/details/115669736

版权

算法工程师笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

自己在学习的过程中，处理图片的时候总是无法避免需要使用CNN来对图片进行处理，但是从大三学过CNN之后，总是在要使用的时候将最基础的知识给忘记了。
为了避免自己下一次忘记，或者说帮助自己下一次快速地想起此基础知识。写下这个博客

CNN：

解释：

对于一个图片分为（ c，w，h）通道数（一般3，rgb），宽，高的图片。
输入(c, w, h) 经过一个卷积操作 nn.Conv2d()
torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)

输入的 channels 其实就是把图像进行多少次卷积， kernel_size 也就是卷积核的大小。比如常见的（3x3), (5x5).
stride 意思是进行卷积操作时，卷积核每一次移动的步子，比如2，就是每次右移2个单位，

padding 意思是，在进行卷积的时候，由于stride大于1时，可能导致最右，最下的一些像素单位不能够卷积到。就会对整个原始输入进行添加一些无用的 0，让图片能够比较好的进行卷积操作。

计算参数量：

那么计算卷积参数的时候一边是： in_channels * kernel_size（3x3) * out_channels + bias(output_channels)

eg:
网络： nn.Conv2d(3 , 16, kernel_size=5, stride=2) 的参数量：3x5x5x16+16 = 1216
(通过了 pytorch的验证）

计算输出shape：

想象一下卷积的过程，卷积核在原来的二维图像上不断的移动。以此输出结果：
比如输入是（c,w,h) 那么经过上述的例子卷积操作之后，就会得到一个新的输出：
（out_channels, [w-(kernel_size-1)]/stride, [h-(kernel_size-1)]/stride)
比如对于上面例子的卷积操作来说：
假设输入的数据shape（3，82，82），那么输入的shape为（16，39，39）

输出的shape 就与 kernel_size 还有 stride 有关了：

最后做线性变换直接一定要记得自己算出还有多少个神经元啊。不过一般操作差别不大，不会很大影响神经元的数量。。。

FulChou

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CNN 学习总结笔记：

自己在学习的过程中，处理图片的时候总是无法避免需要使用CNN来对图片进行处理，但是从大三学过CNN之后，总是在要使用的时候将最基础的知识给忘记了。为了避免自己下一次忘记，或者说帮助自己下一次快速地想起此基础知识。写下这个博客CNN：解释：对于一个图片分为（ c，w，h）通道数（一般3，rgb），宽，高的图片。输入(c, w, h) 经过一个卷积操作 nn.Conv2d()torch.nn.Conv2d(in_channels, out_channels, kernel_size, st
复制链接

扫一扫