飞桨paddlespeech语音唤醒推理C定点实现

最新推荐文章于 2024-07-12 16:15:47 发布

野生的大熊

最新推荐文章于 2024-07-12 16:15:47 发布

阅读量164

点赞数

文章标签：算法 leetcode 数据结构 microsoft c#

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_78834737/article/details/131875767

版权

做定点实现主要包括两部分工作，一是模型参数的量化和定Q格式等，二是基于Q格式的定点实现。关于模型参数的量化，我曾写过相关的文章（深度学习中神经网络模型的量化），有兴趣的可以去看看。我用的是对称量化，这里简述一下这部分的工作。

1，在python下根据paddlepaddle提供的API（named_parameters）得到模型每层的参数（weight & bias），同时看每层的weight和bias的绝对值的最大值，从而确定参数的Q格式，再以这个Q格式对weight 和bias做量化。

2，在python下得到测试集里非常多个文件每层的输入和输出的绝对值的最大值，从而确定每层的输入和输出的Q格式。

至于代码的定点化，主要包括如下几点：

1，卷积层的定点化

主要是做好乘累加以及输出的移位和防饱和处理。在文章（深度学习中神经网络模型的量化）里有详细描述，这里就不细讲了。

2， sigmoid的定点化

调研了一下，sigmoid的定点化主要用查表法来实现。Sigmoid(x)在x<=-8时近似为0，在x>=8时近似为1，因此做表时在

最低0.47元/天解锁文章

野生的大熊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
飞桨paddlespeech语音唤醒推理C定点实现

即算出的浮点的fbank值作为浮点实现模型的输入，将浮点的Fbank值根据定标转换成定点值作为定点实现模型的输入，然后每层的浮点实现和定点实现并行运行。1，在python下根据paddlepaddle提供的API（named_parameters）得到模型每层的参数（weight & bias），同时看每层的weight和bias的绝对值的最大值，从而确定参数的Q格式，再以这个Q格式对weight 和bias做量化。下图给出了调试好后部分层的欧氏距离的值，都是很小的（图中0/1/2等表示卷积层ID）。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。