AI模型部署技术

shengyin714959

于 2024-08-06 10:28:38 发布

阅读量117

点赞数 4

分类专栏：笔记最高笔记文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shengyin714959/article/details/140948743

版权

笔记同时被 2 个专栏收录

1319 篇文章 73 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

499 篇文章 1 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

1. 了解机器学习模型的部署
与部署软件或应用程序相比，模型部署是不一样的。一个简单的ML模型生命周期会有如下这些阶段，如范围界定、数据收集、数据工程、模型训练、模型验证、部署和监控。

当我们在部署ML模型时，需要考虑一些因素，比如：

模型的大小和打包——模型的大小对我们如何打包有巨大的影响。较小的模型通常可以被放置在FastAPI服务器中，并在Docker容器中进行封装。然而，较大的模型可能需要在部署期间加载——从远程存储中拉取，并通过模型服务器（如TFServing或TorchServer）运行。
模型的再训练和版本维护——对模型的再训练频率影响着部署策略。你是否经常需要比较你的模型性能？你在生产环境中需要多长时间才能更新你的模型？你会在生产环境中维护你的模型的不同版本吗？
流量和请求路由——根据流量和模型的类型决定实时推理或批量模型部署。你想将多少流量分流到每个版本的模型？有多少用户会有机会访问某一个模型版本？
数据和概念漂移——随着时间的推移，现实世界的数据在不断变化，这可能不会被反映在模型中。比如说，购买力与工资的关系如何，可能每年或每月都在变化。或者在新冠疫情期间，消费者的购买模式如何变化。但模型大多依赖于历史数据，这影响到我们的部署架构设计：我们应该重新训练和重新部署吗？我们是否应该暂时只对模型进行重新训练和阶段性的调整？这个因素在数据科学团队的长期部署战略中发挥较大的作用。
对于这些因素，我们有模型部署的六个常见策略。这些策略主要是从DevOps和UX方法论中借用的&

了解本专栏

超级会员免费看

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
AI模型部署技术

一旦更新通过测试和验证，用户的请求就会被路由到较新的系统，其实本质上是把旧的模型换成新的。假设你目前有4个正在运行应用程序的pod，然后使用滚动更新策略部署新版本的模型，这样一个接一个的pod会被替换成新的。我们将如何部署模型的最新版本？WHAT：在Canary部署中，我们将更新后的模型部署到我们现有的系统中，并给部分用户推送新版本模型。Canary是基于会话亲和性（来自客户端的请求总是路由到同一个服务器进行处理）的，大多数情况下，同一组用户将看到最新的模型，而在A/B测试中，用户被随机发送到不同的版本。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shengyin714959 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。