MLOps工具链实战笔记_01

vanilla698

已于 2023-12-13 17:34:32 修改

阅读量133

点赞数 5

分类专栏：机器学习文章标签：笔记人工智能机器学习深度学习数据仓库 nlp gpt

于 2023-12-13 16:10:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vanilla698/article/details/134974622

版权

本文详细介绍了MLOps在模型开发、产品化与部署、监控等方面的作用和流程，强调了降低风险、识别数据漂移的重要性。针对数据科学家、DevOps团队和业务专家的关注点，提出了模型迭代、生命周期管理和治理的解决方案，旨在实现高效、可靠的机器学习模型运营。

摘要由CSDN通过智能技术生成

一、概念

ML概念参考文章

二、作用

降低风险
识别漂移

三、用户

行业专家
数据科学家
数据工程师
软件工程师
DevOps团队
模型风险管理者/审计师
机器学习架构师

四、流程

1、模型开发

1.1、建立业务目标

例如
- 将欺诈交易的占比减小到0.1以下
包括
- 变更管理
  - 作用
    - 为如何构建ML模型提供一些指导
    - 透明度将极大的影响算法的选择
    - 推动提供解释和预测的需求
    - 预测转化为业务层面有价值的决策

1.2、数据源与探索性数据分析

寻找相关数据
- 相关数据集？
- 可靠性、准确性如何？
- 不同用户访问数据权限如何？
- 数据组合的属性是什么？特征是什么？
- 数据实时吗？
- 是否需要标记「基础事实」？
- 学习方式如何？
  - 无监督？
  - 有监督？
- 标注花费资源？
- 平台？
- 模型全周期的数据更新方法是什么？
- 数据代表性？
- KPI衡量？
数据治理
- 数据集是否允许商用？
- 是否有条款？
- 是否需要脱敏、加密？
- 不能合法使用的信息？
- 数据是否有代表性？

1.3、特征工程与特征选择

数据清洗：清除空值、重复等不合格数据

1.4、训练与评估

过程
- 测试多种算法
- 自动生成特征
- 调整特征选择
- 调整算法超参
方式
- 集中训练
  - 特斯拉案例
  - 将来自数百万个模型实例的所有反馈传递到一个中心点
  - 运行在50万台汽车中，自动驾驶，完全再训练需要70000个GPU/小时
- 本地训练
  - 谷歌案例
  - 每一部手机都在本地进行再训练，并集中向谷歌发送改进总结。

最低0.47元/天解锁文章

关注

5
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
MLOps工具链实战笔记_01

MLOps工具链产品设计思路与问题解决方案
复制链接

扫一扫

专栏目录

vanilla698 CSDN认证博客专家 CSDN认证企业博客

码龄7年

16: 原创

44万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

555: 积分

230: 粉丝

266: 获赞

4: 评论

231: 收藏

私信

关注

热门文章

分类专栏

机器学习 13篇
机器学习by周志华 8篇

最新评论

《机器学习by周志华》学习笔记-决策树-01
阿龙先生啊: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！
《机器学习by周志华》学习笔记-线性模型-03
孤寒者: 持续学习！
《机器学习by周志华》学习笔记-线性模型-02
阿龙先生啊: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。期待博主未来能够持续分享更多好文，同时也希望能够得到博主的指导，共同进步。非常感谢博主的分享和支持！
《机器学习by周志华》学习笔记-线性模型-01
孤寒者: 持续学习！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

vanilla698 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。