- 没有数据版本控制,因此不支持随时间推移的可重复性
- 模型的代码在本地计算机上手动触发,并不断更新,无需版本控制
- 完全缺少通过通用平台共享数据和代码
- 预测过程不表示为业务流程,所有步骤都是分散的和不同步的,并且大多数步骤都需要手动操作
- 数据和模型的实验不可重现且不可审计
- 在内存消耗增加或占用大量 CPU 的操作的情况下,不支持可伸缩性
- 目前不支持对整个过程进行监控和审计
下图演示了新架构的四个主要组件:监视和审计平台、模型部署平台、模型开发平台和数据管理平台。
**图 1.**MLOps 体系结构图
平台设计决策
设计 MLOps 平台时要考虑的两个主要策略是:
- 从头开始开发与选择平台
- 在基于云的、本地或混合模型之间进行选择
从头开始开发与选择完全打包的 MLOps 平台
从头开始构建 MLOps 平台是最灵活的解决方案。它将提供解决公司未来任何需求的可能性,而无需依赖其他公司和服务提供商。如果公司已经拥有所需的专家和训练有素的团队来设计和构建 ML 平台,那将是一个不错的选择。
预打包解决方案是模拟不需要大量自定义的标准 ML 流程的不错选择。一种选择甚至是购买一个预训练的模型(例如,模型即服务),如果市场上有售,并只围绕它构建数据加载、监控和跟踪模块。这种解决方案的缺点是,如果需要添加新功能,可能很难按时完成这些添加。
将平台作为黑匣子购买通