摘要:
我们在设计一个CNN网络时,通常要考虑两个事情,一个是这个网络需要的计算量有多大,一个是这个模型的参数量有多少。前者决定了网络训练的快慢(硬件设备确定的情况),后者决定了计算设备需要多大的内存或显存。
背景:
本文CNN的计算量以计算机做乘加次数为单位,即完成某个操作,需要执行多少次乘法和加法操作。参数量以参数个数为单位,要计算内存或显存的,用参数量乘以每个参数所占的字节数即可。
CNN计算量:
首先,一个的卷积,执行一次卷积操作,需要次乘法操作(卷积核中每个参数都要和特征图上的元素相乘一次),-1次加法操作(将卷积结果,