用于机器学习开发和模型治理的专用工具日益变得重要

最新推荐文章于 2024-06-25 00:27:22 发布

OReillyData

最新推荐文章于 2024-06-25 00:27:22 发布

阅读量695

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zkh880lolh3h21ajth/article/details/98539950

版权

随着机器学习项目增加，工具如MLflow等用于管理开发和治理模型的需求日益增长。MLflow因其轻量级开放接口及实验跟踪、多阶段管道管理和模型封装功能受到欢迎。模型治理成为关键，涉及模型权限、版本控制、审计和监控。创业公司如Datatron正着手构建模型治理解决方案，以应对企业中不断增多的机器学习模型及其合规需求。

摘要由CSDN通过智能技术生成

编者注：文中超链接如果不能访问可以点击“阅读原文”访问本文原页面；敬请查看2019年9月23-26日纽约Strata数据大会完整日程安排。

几年前我们开始发布文章（参见本文末尾的“相关资源”），了解数据团队开始接受更多机器学习（ML）项目时所面临的挑战。在此过程中，我们描述了一个新的工作角色/岗位：机器学习工程师，其专注于创建数据产品，并使数据科学在生产环境中发挥作用，这一角色在两年前开始在旧金山湾区出现。当时，没有任何流行的工具可以解决机器学习落地团队所面临的问题。

大约10个月前，Databricks发布了MLflow，这是一个用于管理机器学习开发的新开源项目（完全披露利益相关：Ben Lorica是Databricks的顾问）。我们认为，由于缺乏明确的开源竞品替代方案，MLflow有很大的机会吸引用户使用，事实证明情况确实如此。在相对较短的时间内，MLflow在GitHub上获得了超过3,300颗星，来自40多家公司有80多名工程师成为了代码贡献者。最重要的是，超过200家公司正在使用MLflow。

那么，为什么这个新的开源项目会引起数据科学家和机器学习工程师的共鸣呢？回想一下机器学习项目的关键属性：

与目标是满足功能参数的传统软件不同，在机器学习中，我们的目标是优化指标。
质量不仅取决于代码，还取决于数据，优化方法，定期更新和重新训练。
参与机器学习的人通常希望尝试新的库，算法和数据源 – 因此，必须能够将这些新组件投入生产环境。

MLflo

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。