- 博客(5)
- 收藏
- 关注
原创 《A White Paper on Neural Network Quantization》翻译总结
这部分内容主要探索量化的硬件背景以及如何让推理在设备上跑起来。图1展示了神经网络中矩阵向量乘法yWxb的计算示意图,这是矩阵乘法和卷积的一个基础组件,主要通过尽可能多的计算并行来提高NN推理的效率。该神经网络加速器的两个基本组件分别是:processing elements(Cnm)和accumulators(AnAnbnm∑Cnm其中CnmWnmxmWnm为权重值,xm为输入数据,bn。
2023-03-17 18:16:25 329
原创 TVM的安装编译
最近想想学习一下TVM,结果只是安装编译就花了两天多的时间。由于环境不同,官网的安装教程有很多坑需要自己趟,特此记录一下,希望能帮大家节省时间。
2023-01-18 17:00:24 318
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人