在深度学习中一般1个token是32个bit。 因此,计算方式如下: 总字节数=1000000000✖4=4000000000 依次转成总KB、MB、GB数=4000000000➗1024➗1024➗1024=3.725GB