百度飞桨的 Paddle Serving 能够实现服务器端快速部署,最近,随着飞桨更新到 1.7 版本,Paddle Serving 也有了新变化。更新后的 Paddle Serving 有哪些改进?能给用户带来多大程度的生产力提升?本文将带你一睹为快。
古人云:行百里者半九十。相信在深度学习领域中,不少做算法的小伙伴都会对这句话产生共鸣。辛辛苦苦搭建好网络,望眼欲穿得训练调试好模型,等到最后要部署,面对纷繁复杂的实际部署环境时,才发现原来终极大魔王在这里!
当然这个魔王不会喊打喊杀,但他会给你出难题,情景可能是这样的:
在此紧要关头,是否有什么捷径帮助小伙伴顺利通关呢?这个真的可以有,那就是国内最早开源开放、功能完备的开源深度学习平台飞桨所提供的 Paddle Serving 功能。
Paddle Serving 是飞桨的服务化部署框架,长期目标就是为人工智能落地的最后一公里提供越来越专业、可靠、易用的服务。随着飞桨开源框架推出最新的 1.7 版本,Paddle Serving 的最新版本也闪亮登场。有了它,和魔王的对话情景就要变一变啦!
Paddle Serving 真的那么好吗?当然!Paddle Serving 秉承模型即服务(Model As A Service,MAAS)的理念,全面打通并自动化飞桨训练框架与 Paddle Serving 的衔接流程,让用户在使用飞桨成功完成模型训练的那一刻,收获的不再只是模型,而是同时拥有了该模型的推理服务,使用户能够在几分钟内将模型转化为一个可以在服务器端部署的远程服务。总的来说,Paddle Serving 具有如下四大特点:
简单易用:为了让使用飞桨的用户能够以极低的成本部署模型,Paddle Serving 设计了一套与飞桨开源框架无缝打通的预测部署 API。对于不需要较为复杂的数据预处理过程的普通模型来说,每一位模型算法工程师仅使用一行命令就可以轻松部署自己的模型服务。
工业可用:为了达到工业级深度学习模型在线部署的要求,Paddle Serving 提供很多大规模场景需要的部署功能:
分布式稀疏参数索引功能。
高并发底层通信能力。
模型管理、在线 A/B 流量测试、模型热加载。
功能扩展:当前 Paddle Serving 支持 C++、Python、Golang 的客户端,未来也会面向不同类型的客户新增多种语言的客户端。在 Paddle Serving 的框架设计方面,尽管当前版本以支持飞桨模型的部署为核心功能,但是用户也可以很容易嵌入其它的机器学习库部署在线预测服务。
高性能引擎支持:飞桨的 Paddle Inference 原生推理库作为当前 Paddle Serving 唯一支持的后端推理引擎,具备诸多高性能的特性,例如内存/显存复用、算子自动融