机器学习系统(ML)中隐藏的技术债务(2)

最新推荐文章于 2024-09-26 17:23:00 发布

技术与健康

最新推荐文章于 2024-09-26 17:23:00 发布

阅读量705

点赞数 13

分类专栏：神经网络文章标签：人工智能机器学习

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/Practicer2015/article/details/141205739

版权

神经网络专栏收录该内容

8 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

复杂模式侵蚀边界

传统的软件工程实践表明，使用 "封装"（en- capsulation）和模块化设计来划分严格的抽象边界，有助于创建可维护的代码，从而便于进行孤立的更改和改进。严格的抽象边界有助于表达给定组件的信息输入和输出的不变性和逻辑一致性。

遗憾的是，很难通过规定特定的预期行为来为机器学习系统设定严格的抽象边界。事实上，当所需行为无法在不依赖外部数据的情况下用软件逻辑有效表达时，就需要使用机器学习。现实世界并不适合整齐的封装。在此，我们将从几个方面探讨由此造成的边界侵蚀可能会显著增加 ML 系统的技术债务。

机器学习系统会将信号混合在一起，使它们相互纠缠，无法实现等效改进。例如，考虑一个在模型中使用特征 x1 , ...xn 的系统。如果我们改变 x1 中值的输入分布，其余 n - 1 个特征的重要性、权重或使用情况都可能发生变化。不管是以批处理方式对模型进行全面重新训练，还是让模型以在线方式进行调整，情况都是如此。添加新的特征 xn+1 也会引起类似的变化，删除任何特征 xj 也是如此。没有任何输入是真正独立的。我们将此称为 CACE 原则：任何改变都会改变一切。CACE 不仅适用于输入信号，也适用于超参数、学习设置、采样方法、收敛阈值、数据选择以及其他所有可能的调整。

数据依赖的成本高于代码依赖

不稳定的数据依赖。为了快

了解本专栏

超级会员免费看

技术与健康

关注

13
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。