NLP 训练及推理一体化工具（TurboNLPExp）

最新推荐文章于 2023-05-07 10:05:56 发布

腾讯技术工程

最新推荐文章于 2023-05-07 10:05:56 发布

阅读量1.1k

点赞数

文章标签： c++ 大数据编程语言 python 机器学习

本文链接：https://blog.csdn.net/Tencent_TEG/article/details/113409057

版权

TurboNLP是由腾讯TEG研发的训练和推理一体化工具，旨在解决NLP任务的训练、复用和上线难题。训练框架TurboNLP-exp提供模块化配置、多平台支持和多任务训练，而推理框架TurboNLP-inference支持高性能推理，内置多种NLP模型，降低推理延迟。NLP一体化工具显著节省了人力和计算资源，已在多个业务中成功应用。

摘要由CSDN通过智能技术生成

作者：TurboNLP，腾讯 TEG 后台工程师

导语

NLP 任务（序列标注、分类、句子关系判断、生成式）训练时，通常使用机器学习框架 Pytorch 或 Tensorflow，在其之上定义模型以及自定义模型的数据预处理，这种方式很难做到模型沉淀、复用和共享，而对于模型上线同样也面临：上线难、延迟高、成本高等问题，TEG-AI 平台部-搜索业务中心从 2019 年底开始，前期经过大量调研，在 AllenNLP 基础上自研了推理及训练一体化工具 TurboNLP，涵盖了训练框架 TurboNLP-exp 和推理框架 TuboNLP-inference，TurboNLP-exp 训练框架具备可配置、简单、多框架、多任务、可复用等特点，在其之上能够快速、高效的进行 NLP 实验.

TurboNLP-inference 推理框架底层支持高效的模型推理库 BertInference，集成了常用的 NLP 模型，具备无缝兼容 TurboNLP-exp、推理性能高（在 BERT-base 文档分类业务模型上实测，FP6 精度在 batch_size=64、seq_len=64 的情况下达到了 0.275ms/query，INT8 精度在 batch_size=64、seq_len=64 的情况下达到了 0.126ms/query 性能）等特点，NLP 训练和推理一体化工具极大的简化了训练到推理的流程，降低了任务训练、模型上线等人力成本，本文将主要介绍 NLP 训练和推理一体化工具。

背景

NLP 任务通常是算法研究者自定义模型和数据预处理在机器学习框架Pytorch或Tensorflow进行训练，并手动部署到 libtorch 或 tensorflow 上，这一过程存在如下问题：

NLP 任务已有的模型结构和数据预处理重新定义，重复性高。
手动修改模型结构和数据预处理代码，不断调整训练参数，反复试验，造成代码混乱。
模型复杂度（多模型多任务）高或需要对现有模型进行优化改进时，如不熟悉模型结构，就需要重头梳理 Python 定义的模型和数据预处理代码。
知识沉淀、模型复用及共享困难。
上线难、数据预处理 C++化复杂、推理延迟高。
流程化提升 NLP 任务的离线训练及效果实验效率困难，试错成本高。

为了解决以上存在的痛点，在此背景下，我们打通了 NLP 训练端到推理端、自研了训练框架TurboNLP-exp及推理框架TuboNLP-inference，以下是框架的整体架构图：

简介

训练框架 TurboNLP-exp
- TurboNLP-exp 具备模块化、可配置、多平台支持、多任务支持、多模型格式导出、C++数据预处理等特点、既能满足研究者快速实验、也能将模型通过配置沉淀到框架上，后续研究者通过配置来复用和共享知识。
- TuboNLP-exp 对模型和数据预处理进行了模块化设计，对于数据预处理，针对同一类 NLP 任务（序列标注、分类、句子关系判断、生成式）数据预处理基本一样，通过复用配置即可复用已有的数据预处理；对于模型，TurboNLP-exp 集成了丰富的子模块：embedder、seq2seq_encoder、seq2vec_encoder、decoder、attention 等，通过配置随意的构建模型，达到快速实验目的。
- TuboNLP-exp 对底层机器学习平台（Pytorch 和 Tensorflow）进行了统一的封装，熟悉不同的机器学习平台丝毫不影响模型的复用、共享和知识沉淀。
  <

最低0.47元/天解锁文章