AI常见部署方式

HJZ11

已于 2022-07-08 15:25:31 修改

阅读量5k

点赞数 3

分类专栏：深度学习计算机视觉CV 文章标签：人工智能深度学习 tensorflow

于 2020-12-08 09:36:34 首次发布

本文链接：https://blog.csdn.net/HJZ11/article/details/109175138

版权

计算机视觉CV 同时被 2 个专栏收录

25 篇文章

订阅专栏

深度学习

1 篇文章

订阅专栏

文章目录

- 1.AI部署简介
- 2.具体部署

1.AI部署简介

没人告诉你的大规模部署AI高效流程！

对大部分 TensorFlow 模型来说，部署流程是相同的：

 1. 将图像固化为 Protobuf 二进制文件
 2. 调整推断代码，使它可以处理固化的图
 3. 容器化应用程序
 4. 在最上面加上 API 层

本文提出了一个大规模部署 AI 的高效工作流程：

固化图并将推断封装在 API 下
重复使用会话和图，缓存输入和输出
用 Docker 容器化应用程序（包括 API 层）
将大规模应用程序与 Kubernetes 一起部署在你选择的云上
将训练从推断中分离出来
建立任务队列，将较小的任务确立为优先级
使用这些技术，你就可以在成本最小、速度和效率最大的情况下大规模部署 AI。

2.具体部署

客户端 ----> web服务(flask或者tornado) --grpc或者rest--> tensorflow serving

确定好输入和输出节点，把模型导出成SavedModel格式，
然后用TF-Serving启动服务，
调用方发http请求或者grpc请求就可以拿到预测结果

可以做成一个http服务,提供一个web接口,模型只在服务器上就可以了.
使用时候客户端通过http请求上传要识别的图片等数据到服务端接口,服务端计算后返回给客户端.

在服务端训练出特定的算法模型——再将这个模型部署到服务端或者终端（以后大多数场景下是部署到终端）——需要服务端AI框架到终端AI推理框架的转换工具。

Tensorflowserving:

常用的做法如使用flask、Django、tornado等web框架创建一个服务器app，这个app在启动后就会一直挂在后台，然后等待用户使用客户端POST一个请求上来（例如上传了一张图片的url），app检测到有请求，就会下载这个url的图片，接着调用你的模型，得到推理结果后以json的格式把结果返回给用户。
这个做法对于简单部署来说代码量不多，对于不熟悉web框架的朋友来说随便套用一个模板就能写出来，但是也会有一些明显的缺点：
1. 需要在服务器上重新安装项目所需的所有依赖。
2. 当接收到并发请求的时候，服务器可能要后台启动多个进程进行推理，造成资源紧缺。
3. 不同的模型需要启动不同的服务。
而为了解决第一个问题，Docker是最好的方案。

在这里插入图片描述