@苹果树数据科技有限公司-AI部 BERT所占内存的计算 以BERT-base为例,占用110million的参数,数据格式为半精度浮点型(FP16),则占用内存的计算如下: 1B=8字节 FP16表示16字节 则总共内存占用为:110*10^6*16 / 8 = 0.22*10^9 换算成GB:0.22*10^9 / (1024^3) = 0.205GB