卷积神经网络的参数计算

最新推荐文章于 2024-04-14 08:30:14 发布

VIP文章 qian99

最新推荐文章于 2024-04-14 08:30:14 发布

阅读量8.7w

点赞数 138

分类专栏：人工智能深度学习文章标签：卷积神经网络 vgg googlenet

本文链接：https://blog.csdn.net/qian99/article/details/79008053

版权

前言

这篇文章会简单写一下卷积神经网络上参数的计算方法，然后计算各个常见神经网络的参数。一个是加强对网络结构的了解，另一方面对网络参数的量级有一个大概的认识，也可以当作备忘录，免得想知道的时候还要再算。

此外，还有个比较有争议的点，评论区里也有人指出，关于全连接中bias(偏置)的计算，我看的一些资料里参数的数量是1，但是在用的深度学习框架中(tensorflow和pytorch)基本都是和输出层的元素的数量相同，我的看法的话，第二种可能效果更好一些吧，这样会有更高的自由度，或许有相关的论文，但是我没发现。不过这一点其实影响不大的，因为bias所占的参数量的比重很小，所以无论用哪种计算方法最终的结果基本没什么差别。

参数计算方法

全连接的参数计算就不说了，比较简单。
首先，简单说一下卷积网络的参数计算。下图中是一个32x32x3的输入，然后用一个5x5x3的卷积对其中某个位置的计算，这里算的是一个点积，所以输出是一个单独的标量的值。

因为卷积的操作是通过一个滑动窗口实现的，那么通过卷积操作，我们就得到了一个28x28x1的输出。

如果我有6个上面说的filter，那么，我就会得到一个28x28x6的输出。

这就是一个最基础的卷积操作，那么这里用到的参数是多少呢？我们只需要把每个filter的参数累加起来，当然，不要忘了加上bias：5x5x3x6 + 6 = 456

另外一个需要计算的就是进行卷积以后的输出的大小，从下面的图上看就很好理解了，用公式直接算就好了。其中N是输入图像的size，F是filter的size，stride是滑动的步长。

然后从上图中最后一个例子可以看到，stride大于1的时候不一定能整除，这个时候，就需要在原图像上加上一层padding层，这样图像的大小就变化了，然后再用前面的公式算就行了。

然后还有一个maxpooling操作，这个会改变输入输出，但是不会有参数。所以使用和计算卷积一样的公式算就行了。

LeNet

首先计算一下最简单的LeNet。网络结构如下：

网络层（操作）	输入	filter	stride	padding	输出	计算公式	参数量
Input	32x32x1				32x32x1		0
Conv1	32x32x1	5x5x6	1	0	28x28x6	5x5x1x6+6	156
MaxPool1	28x28x6	2x2	2	0

最低0.47元/天解锁文章

qian99

关注

138
点赞
踩
703

收藏

觉得还不错? 一键收藏
33
评论
卷积神经网络的参数计算

前言这篇文章会简单写一下卷积神经网络上参数的计算方法，然后计算各个常见神经网络的参数。一个是加强对网络结构的了解，另一方面对网络参数的量级有一个大概的认识，也可以当作备忘录，免得想知道的时候还要再算。参数计算方法全连接的参数计算就不说了，比较简单。首先，简单说一下卷积网络的参数计算。下图中是一个32x32x3的输入，然后用一个5x5x3的卷积对其中某个位置的计算，这里算的是一个
复制链接

扫一扫