文献阅读（83）HAQ

tiaozhanzhe1900

已于 2022-04-28 08:38:55 修改

阅读量416

点赞数 1

分类专栏：算法论文文章标签：强化学习

于 2020-03-20 11:03:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tiaozhanzhe1900/article/details/102586672

版权

算法论文专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章目录

1 abstract & introduction &related work
2 approach

题目：HAQ: Hardware-Aware Automated Quantization with Mixed Precision
时间：2019
会议：IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
研究机构：韩松
github: https://github.com/mit-han-lab/haq-release

他引用的论文
A scalable bit-serial matrix multiplication overlay for reconfigurable computing
Bit fusion: Bit-level dynamically composable architecture for accelerating deep neural network
Netadapt: Platform-aware neural network adaptation for mobile applications

1 abstract & introduction &related work

确定每层网络的量化位宽，设计空间过大

H：硬件平台数量
M：M个网络模型
N：一个网络有N层
假设每层网络weight和activation的位宽是1-8bit之间，则可能性有 $O(H*M*8^{2N})$ 种

人工定点化时一些的规律：

第一层和最后一层位数多一点
卷积层更敏感，位宽要比全连接层多

本篇论文的贡献：

自动化的Hardware-Aware Automated Quantization (HAQ) framework
硬件可以直接反馈
强化学习采用了deep deterministic policy gradient

related work

quantization
autoML
efficient model

2 approach

在这里插入图片描述

2.1 observation(state space)

这里定义了状态，分成卷积层和全连接层

2.2 action space

一旦硬件的指标不满足，就会降低每层的位宽来满足限制

2.3 硬件的直接反馈

2.4 量化

就是正常的量化策略，先截断，再就近取数
本篇论文的量化可以分成三种：

延时限制的量化
能耗限制的量化
模型大小限制的量化

2.5 reward function奖励函数

奖励函数只跟准确率有关

2.6 agent

利用了这个算法deep deterministic policy gradient(DDPG)

tiaozhanzhe1900

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。