python自然语言处理-bert实战_《从零开始学习自然语言处理(NLP)》-BERT推理加速实践（6）...

最新推荐文章于 2024-06-24 22:35:37 发布

weixin_39876002

最新推荐文章于 2024-06-24 22:35:37 发布

阅读量498

点赞数

文章标签： python自然语言处理-bert实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39876002/article/details/111444279

版权

背景介绍

BERT推理加速的理论可以参考之前的博客《从零开始学习自然语言处理(NLP)》-BERT模型推理加速总结(5)。这里主要介绍基于Nvidia开源的Fast Transformer，并结合半精度模型量化加速，进行实践，并解决了TensorFlow Estimator预测阶段重复加载模型的问题。主要包括：

环境搭建

Pre-train模型获取

结合自身业务Fine-tuning

模型单精度(FP32)转半精度(FP16)

Fast-transformer编译

Fast-transformer集成

TensorFlow estimator线上推理

下面逐个进行介绍。

环境搭建

BERT的Fine-tuning需要GPU环境(CPU训练估计要慢到天长地久)，而GPU的环境配置又相对麻烦。除了显卡驱动外，还需要对应版本的安装CUDA、CUDNN、Python、TensorFlow-GPU。版本不匹配很容易出问题。简单的环境搭建，推荐直接使用Nvidia的NGC镜像。针对BERTFine-tuning(Pre-train同样适用)，本文中使用Docker镜像：nvcr.io/nvidia/tensorflow:19.10-py3(镜像说明：https://ngc.nvidia.com/catalog/containers/nvidia:tensorflow)。

镜像主要包括：

Python 3.6.8

Tensorflow-estimator 1.14.0

Tensorflow-gpu 1.14.0+nv

TensorRT 6.0.1(Fast transformer基于TensorRT实现，需要依赖TensorRT)

Pre

最低0.47元/天解锁文章

weixin_39876002

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python自然语言处理-bert实战_《从零开始学习自然语言处理(NLP)》-BERT推理加速实践（6）...

背景介绍BERT推理加速的理论可以参考之前的博客《从零开始学习自然语言处理(NLP)》-BERT模型推理加速总结(5)。这里主要介绍基于Nvidia开源的Fast Transformer，并结合半精度模型量化加速，进行实践，并解决了TensorFlow Estimator预测阶段重复加载模型的问题。主要包括：环境搭建Pre-train模型获取结合自身业务Fine-tuning模型单精度(FP32)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。