模型参数量
衡量标准
模型参数量用个数来衡量,参数量为600M,则以为着模型有600M个参数。一般默认模型采用FP32的精度进行存储,也就是1个参数用32位(bit)存储,也就是说,600M个参数需要用
600
M
∗
32
=
19200
M
600M*32=19200M
600M∗32=19200M的bit进行存储,也就是需要
600
M
∗
32
8
=
2400
M
\frac{600M*32}{8}=2400M
8600M∗32=2400M字节(Byte)进行存储。
简记: 参数量:所占字节数 = 1:4
常见的单位换算:
8bit = 1Byte(字节)
1kb = 1024Btye
1Mb = 1024kb
1Gb = 1024Mb
参数计算
- 对卷积层 C o n v ( C i n , C o u t , K h , K w ) Conv(C_{in}, C_{out}, K_{h}, K_{w}) Conv(Cin,Cout,Kh,Kw)
P a r a m s = P a r a m s w + P a r a m s b = C i n ∗ C o u t ∗ K k ∗ K w + C o u t Params = Params_w + Params_b = C_{in}*C_{out}*K_{k}*K_{w} + C_{out} Params=Paramsw+Paramsb=Cin∗Cout∗Kk∗Kw+Cout
- 对FC层 L i n e a r ( N i n , N o u t ) Linear(N_{in}, N_{out}) Linear(Nin,Nout)
P a r a m s = P a r a m s w + P a r a m s b = N i n ∗ N o u t + N o u t Params = Params_w + Params_b = N_{in}*N_{out} + N_{out} Params=Paramsw+Paramsb=Nin∗Nout+Nout
参考资料:
1.神经网络模型计算量 & 参数量 解释_小幸运-程序员资料
2.模型大小 与参数量计算_华为云_ 风吹稻花香的博客
3.字节、KB、MB、GB 之间的换算关系 Bps和bps的区别_CSDN_wust小吴的博客