机器学习模型带动业务增长已经在头部企业(特别是大厂)得到成功认证。越来越多的企业都在增加人工智能,机器学习模型的投入,并将从模型训练逐渐过渡到模型部署与落地。因为只有将模型部署到生产中才能验证其对于业务的真正价值。
那么,人工智能团队将如何在实际生产中部署,维护与监控这些模型呢?
答案可能是MLOps。
什么是MLOps?
MLOps是DevOps的一种扩展,旨在可靠且高效地在生产,部署和维护机器学习模型。与DevOps方法类似,MLOps旨在加强自动化程度并提高模型的质量,同时也关注业务和监管要求。它是一个多学科的领域,存在于DevOps,机器学习,软件工程的交汇处。
2021年甚至被称为MLOps年,特别在美国诞生了许多相关工具与初创企业。MLOps涵盖内容也非常广泛,包括:
- 可重现和协调的数据管道,
- 模型运行监控与报错,
- 可溯源的模型版本控制,
- 可自动扩展的模型服务,
- 数据版本控制和数据沿袭,
- 特征值存储,等等。
对于一个现代化的MLOps生态系统,我们可以找到不少端对端(