持续更新…… 压缩率:压缩前后模型size变化程度。 对量化而言,32bit的数据量化至8bit,则压缩率为4x 对剪枝而言,压缩率=1 / (1-FLOPs减少率);如FLOPs减少60%,则压缩率为1/0.4=2.5xFLOPs:FLoating point OPerations,即浮点计算次数,包含乘法和加法,只和模型相关。