Ａ／Ｂ测试的陷阱。在对模型进行过充分的离线评估之后，为什么还要进行在线Ａ／Ｂ测试？如何进行线上Ａ／Ｂ测试？如何划分实验组和对照组？

最新推荐文章于 2024-04-16 13:54:10 发布

光英的记忆

最新推荐文章于 2024-04-16 13:54:10 发布

阅读量1.2k

点赞数

分类专栏：算法 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29678299/article/details/88758292

版权

tensorflow 同时被 2 个专栏收录

47 篇文章 0 订阅

订阅专栏

34 篇文章 2 订阅

订阅专栏

场景描述：

在户两位公司中，Ａ／Ｂ测试是验证新模块，新功能，新产品是否有效，新算法，新模型的效果是否有提升，新设计是否受到用户欢迎，新更改是否影响用户体验的主要测试方法。在机器学习领域中Ａ／Ｂ测试是验证模型最终效果的主要手段。

在对模型进行过充分的离线评估之后，为什么还要进行在线Ａ／Ｂ测试？

需要进行在线Ａ／Ｂ测试原因如下

一：离线评估无法完全消除模型过拟合的影响，因此得出的离线评估结果无法完全替代线上评估结果。

二：离线评估无法完全还原线上的工程环境。一般来讲，离线评估往往不会考虑线上环境的延迟，数据丢失，标签数据缺失等情况。因此，离线评估的结果是理想工程环境下的结果。

三：线上系统的某些商业指标在离线评估中无法计算。离线评估一般针对模型本身进行评估，而与模型相关的其他指标，特别是商业指标，往往无法直接获得。

比如上了新的推荐系统，离线评估更加关注的是ＲＯＣ曲线，Ｐ－Ｒ曲线等的改进，而线上苹果可以全面了解该推荐算法带来的用户点击率，留存时长，ＰＶ访问量等的变化，这些都是有Ａ／Ｂ测试来进行全面的评估。

如何进行线上Ａ／Ｂ测试？

进行Ａ／Ｂ测试的主要手段是进行用户分桶，即将用户分为实验组和对照组，对实验组的用户施以新模型，对照组的用户施以旧模型。在分桶的过程中，要注意样本的独立性和采样方式的无偏性，确保同一个用户每次只能分到一个桶里，在分桶过程中选取的ｕｓｅｒ＿ｉｄ需要是一个随机数，这样才能保证桶中的样本是无偏的。

如何划分实验组和对照组？

组合一定是整个针对用户的全集，没有偏差的分离，不互相包含。在分桶的过程中，要注意样本的独立性和采样方式的无偏性，确保同一个用户每次只能分到一个桶里，在分桶过程中选取的ｕｓｅｒ＿ｉｄ需要是一个随机数，这样才能保证桶中的样本是无偏的。这个过程就是话费实验组和对照组。

光英的记忆

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Ａ／Ｂ测试的陷阱。在对模型进行过充分的离线评估之后，为什么还要进行在线Ａ／Ｂ测试？如何进行线上Ａ／Ｂ测试？如何划分实验组和对照组？

场景描述：在户两位公司中，Ａ／Ｂ测试是验证新模块，新功能，新产品是否有效，新算法，新模型的效果是否有提升，新设计是否受到用户欢迎，新更改是否影响用户体验的主要测试方法。在机器学习领域中Ａ／Ｂ测试是验证模型最终效果的主要手段。在对模型进行过充分的离线评估之后，为什么还要进行在线Ａ／Ｂ测试？需要进行在线Ａ／Ｂ测试原因如下一：离线评估无法完全消除模型过拟合的影响，因此得出的离线评估结果无...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。