VTA中的数据精度变化

最新推荐文章于 2024-07-18 18:08:28 发布

gumx

最新推荐文章于 2024-07-18 18:08:28 发布

阅读量264

点赞数

分类专栏： TVM和VTA 文章标签： fpga开发边缘计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41967987/article/details/126752296

版权

TVM和VTA 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

VTA中的数据精度变化

数据精度在何处定义：

在tvm-main\3rdparty\vta-hw\hardware\xilinx路径下的Makefile是VTA的构建过程。

VTA中的数据精度是由vta_config.json文件指定的，如下图。

Make过程中会调用vta_config.py，该脚本文件会调用pkg_config()函数，该函数会调用pkg_config.py中的PkgConfig()，PkgConfig()会根据vta_config.json文件对如下图所示变量进行赋值，

这些变量稍作处理（加“VTA_”，如下图）会在vta.h和vta.cc中使用。

数据精度的变化和方式：

涉及到数据精度变化的操作有compute中的gemm、ALU，所有的输入、权重和输出采用的均是8bit数据，所有精度变化均采用的是直接截取低8bit的形式。

gemm中数据的位宽如下图所示（黄色加深）：

如上代码中白色标注处，

1：其中每两个8bit的输入i_elem和权重w_elem相乘的结果存入17bit的mul_T prod_dsp中，

2：随后17bit的数据被累加（累加VTA_BLOCK_IN=16次，对输入的16维向量和权重的列向量求向量乘法）到21bit的sum_T tmp中，

3：随后该数据被外层循环（VTA_BLOCK_OUT=16次）累加到32bit的acc_T accum中，

4：然后该数据被写回到累加缓存a_tensor中，

5：最后使用了hls中的range，获取了低8bit数据，将其写回到了输出缓存o_tensor中

如下是查询到的range操作的含义，该操作与C++中的range有所不同，为hls扩展而来：

alu中数据的位宽如下图所示（黄色加深）：

在alu操作中有三种类型分别为：Compute Min/Max、Compute Sum和Compute Shift Right。

Compute Min/Max中计算结果取低8bit写回到输出缓存o_tensor中。

Compute Sum中计算结果取低8bit写回到输出缓存o_tensor中。

Compute Shift Right中会对src_0数据进行shft_by个右移位，shft_by为src_1的低5bit，也就是最大移位值为，5b’11111=5d’31，随后数据被取低8bit给到输出缓存。

总结：需要注意的是在给到输出缓存数据时候，全部对高位宽数据取低8bit，gemm中数据精度变化顺序为8bit->17bit->21bit->32bit，并非直接8bit->32bit，其他指令均未涉及到精度变化。

由于格式问题，以下是本文章的pdf版本：VTA中的数据精度变化

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
VTA中的数据精度变化

VTA加速器中数据精度的变化
复制链接

扫一扫

专栏目录

gumx CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

136万+: 周排名

55万+: 总排名

722: 访问

: 等级

38: 积分

2: 粉丝

0: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

分类专栏

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

专栏结构和内容

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。