动手深度学习笔记（二十三）4.9. 环境和分布偏移

落花逐流水

已于 2022-03-02 21:37:54 修改

阅读量757

点赞数

分类专栏： pytorch实践 pytorch 文章标签： pytorch

于 2022-03-01 22:53:32 首次发布

本文链接：https://blog.csdn.net/juluwangriyue/article/details/123218522

版权

pytorch实践同时被 2 个专栏收录

136 篇文章 112 订阅 ¥29.90 ¥99.00

订阅专栏

pytorch

94 篇文章 12 订阅

订阅专栏

动手深度学习笔记（二十三）4.9. 环境和分布偏移

4. 多层感知机
- 4.9. 环境和分布偏移

4. 多层感知机

4.9. 环境和分布偏移

前面我们学习了许多机器学习的实际应用，将模型拟合各种数据集。然而，我们从来没有想过数据最初从哪里来？以及我们计划最终如何处理模型的输出？通常情况下，开发人员会拥有一些数据且急于开发模型，而不关注这些基本问题。

许多失败的机器学习部署（即实际应用）都可以追究到这种方式。有时，根据测试集的精度衡量，模型表现得非常出色。但是当数据分布突然改变时，模型在部署中会出现灾难性的失败。更隐蔽的是，有时模型的部署本身就是扰乱数据分布的催化剂。举一个有点荒谬却可能真实存在的例子。假设我们训练了一个贷款申请人违约风险模型，用来预测谁将偿还贷款或违约。这个模型发现申请人的鞋子与违约风险相关（穿牛津鞋申请人会偿还，穿运动鞋申请人会违约）。此后，这个模型可能倾向于向所有穿着牛津鞋的申请人发放贷款，并拒绝所有穿着运动鞋的申请人。

这种情况可能会带来灾难性的后果。首先，一旦模型开始根据鞋类做出决定，顾客就会理解并改变他们的行为。不久，所有的申请者都会穿牛津鞋，而信用度却没有相应的提高。总而言之，机器学习的许多应用中都存在类似的问题：通过将基于模型的决策引入环境，我们可能会破坏模型。

虽然我们不可能在一节中讨论全部的问题，但我们希望揭示一些常见的问题，并激发你的批判性思考，以便及早发现这些情况，减轻灾难性的损害。有些解决方案很简单（要求“正确”的数据），有些在技术上很困难（实施强化学习系统），还有一些解决方案要求我们完全跳出统计预测ÿ

了解本专栏

落花逐流水

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
2
评论
动手深度学习笔记（二十三）4.9. 环境和分布偏移

动手深度学习笔记（二十三）4.9. 环境和分布偏移4. 多层感知机4.9. 环境和分布偏移4.9.1. 分布偏移的类型4.9.1.1. 协变量偏移4. 多层感知机4.9. 环境和分布偏移前面我们学习了许多机器学习的实际应用，将模型拟合各种数据集。然而，我们从来没有想过数据最初从哪里来？以及我们计划最终如何处理模型的输出？通常情况下，开发人员会拥有一些数据且急于开发模型，而不关注这些基本问题。许多失败的机器学习部署（即实际应用）都可以追究到这种方式。有时，根据测试集的精度衡量，模型表现得非常出色
复制链接

扫一扫