45.现有移动端开源框架及其特点——QNNPACK-1

全称:Quantized Neural Network PACKage(量化神经网络包)

45.1 特点:

  • 低密度卷积优化函数库;
  • 可在手机上实时运行Mask R-CNN 和 DensePose;
  • 能在性能受限的移动设备中用 100ms 以内的时间实施图像分类;

45.2 QNNPACK 如何提高效率?

  • QNNPACK 使用与安卓神经网络 API 兼容的线性量化方案
    • QNNPACK 的输入矩阵来自低精度、移动专用的计算机视觉模型
    • 其它库在计算A和B矩阵相乘时,重新打包 A 和 B 矩阵以更好地利用缓存层次结构,希望在大量计算中分摊打包开销,QNNPACK 删除所有计算非必需的内存转换,针对 A和B矩阵相乘适用于一级缓存的情况进行了优化。
  • 优化了L1缓存计算,不需要输出中间结果,直接输出最终结果,节省内存带宽和缓存占用
    • 常规实现:在量化矩阵-矩阵乘法中,8位整数的乘积通常会被累加至 32 位的中间结果中,随后重新量化以产生 8 位的输出
        <
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值