1、参与了自研模型压缩工具的开发,主要承担了模型剪枝工具的开发工作;
2、参与了PTQ量化方法、QAT量化工具的开发与性能改进;
3、负责自研模型压缩工具的集成与维护,以及支持事业部深度网络模型的剪枝工作;
4、负责深度网络的加速方法中模型剪枝、量化方向的方法研究;
#1、支持事业部自研视差网络的模型剪枝工作,为视差网络开发自动化剪枝方法,将模型参数量降低到1/3,计算量降低到1/4,在PC平台实现了近2.5倍的加速,帮助自研视差网络在海思、地平线平台的落地;
#2、持续改进自研神经网络推理引擎的量化方法,尝试非对称,零点校准等量化策略,最终网络量化后性能相比于海思3519的量化结果提升30%。
#3、支持事业部的剪枝工作,针对合一智芯NPU平台,开发硬件定制化的非结构化剪枝工具;
#4、主要整理了结构化剪枝和非结构化剪枝方法,输出模型剪枝方法综述,并组织了模型剪枝方法综述的线上分享;