MLOps工具链实战笔记_01

本文详细介绍了MLOps在模型开发、产品化与部署、监控等方面的作用和流程,强调了降低风险、识别数据漂移的重要性。针对数据科学家、DevOps团队和业务专家的关注点,提出了模型迭代、生命周期管理和治理的解决方案,旨在实现高效、可靠的机器学习模型运营。
摘要由CSDN通过智能技术生成

一、概念

  • ML概念参考文章

二、作用

  • 降低风险
  • 识别漂移

三、用户

  • 行业专家
  • 数据科学家
  • 数据工程师
  • 软件工程师
  • DevOps团队
  • 模型风险管理者/审计师
  • 机器学习架构师

四、流程

1、模型开发

1.1、建立业务目标

  • 例如
    • 将欺诈交易的占比减小到0.1以下
  • 包括
    • 变更管理
      • 作用
        • 为如何构建ML模型提供一些指导
        • 透明度将极大的影响算法的选择
        • 推动提供解释和预测的需求
        • 预测转化为业务层面有价值的决策

1.2、数据源与探索性数据分析

  • 寻找相关数据
    • 相关数据集?
    • 可靠性、准确性如何?
    • 不同用户访问数据权限如何?
    • 数据组合的属性是什么?特征是什么?
    • 数据实时吗?
    • 是否需要标记「基础事实」?
    • 学习方式如何?
      • 无监督?
      • 有监督?
    • 标注花费资源?
    • 平台?
    • 模型全周期的数据更新方法是什么?
    • 数据代表性?
    • KPI衡量?
  • 数据治理
    • 数据集是否允许商用?
    • 是否有条款?
    • 是否需要脱敏、加密?
    • 不能合法使用的信息?
    • 数据是否有代表性?

1.3、特征工程与特征选择

  • 数据清洗:清除空值、重复等不合格数据

1.4、训练与评估

  • 过程
    • 测试多种算法
    • 自动生成特征
    • 调整特征选择
    • 调整算法超参
  • 方式
    • 集中训练
      • 特斯拉案例
      • 将来自数百万个模型实例的所有反馈传递到一个中心点
      • 运行在50万台汽车中,自动驾驶,完全再训练需要70000个GPU/小时
    • 本地训练
      • 谷歌案例
      • 每一部手机都在本地进行再训练,并集中向谷歌发送改进总结。
  • 5
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

vanilla698

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值