今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
本PPT已收录到小程序省时查报告中,大家可以到省时查报告小程序中查看并下载文档全文。
今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
本PPT已收录到小程序省时查报告中,大家可以到省时查报告小程序中查看并下载文档全文。