网络模型小型化--量化

在这里插入图片描述

网络模型量化

模型量化

以更少位数的数据类型用于近似表示32位有限范围浮点型数据的过程

模型的输入输出依然是浮点型

达到减少模型尺寸大小、减少模型内存消耗及加快模型推理速度等目标

原理

  • 模型量化桥接了定点与浮点,建立了一种有效的数据映射关系,使得以较小的精度损失代价获得了较好的收益
  • 由浮点到定点的量化
  • 由定点到浮点反量化

优缺点

好处

  • 减小模型尺寸,如8位整型量化可减少75%的模型大小
  • 减少存储空间,在边缘侧存储空间不足时更具有意义
  • 易于在线升级,模型更小意味着更加容易传输
  • 减少内存耗用,更小的模型大小意味着不需要更多的内存
  • 加快推理速度,访问一次32位浮点型可以访问四次int8整型,整型运算比浮点型运算更快
  • 减少设备功耗,内存耗用少了推理速度快了自然减少了设备功耗
  • 支持微处理器,有些微处理器属于8位的,低功耗运行浮点运算速度慢࿰
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值