为什么使用multiarmed bandit algorithms（多臂赌博机算法）--与A/Btest的对比

最新推荐文章于 2023-04-06 22:44:14 发布

我不是狼

最新推荐文章于 2023-04-06 22:44:14 发布

阅读量935

点赞数

分类专栏： EE问题文章标签： A/Btest 多臂赌博机 multiarmed bandit 为什么使用多臂赌博机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012073033/article/details/88634896

版权

EE问题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

当前，问题优化常用的测试方法是使用A/Btest, 即使用随机的相同规模的流量分别进行A组结果或B组结果测试。

那么我们来看下A/Btest 的组成：

一个短时间的纯探索阶段，你需要找相同数量的用户进入A,B组。
一个长时间的利用阶段，即所有用户进入结果更好的实验组，然后不再回退。

为什么说这是一个有缺点的策略：

这是一个探索与利用完全分离的策略，要么纯探索要么纯利用，但是你其实可以在这两个阶段平滑过度。
在纯探索阶段，其实存在一定的资源浪费，就是你一定要拿到相同量级的结果数据，但是当一个实验组的结果显著的非常差的时候，你其实不需要那么多数据来证明结果。

赌博机算法可以为以上两个问题提供解决方案：算法可以平滑的进行两个阶段的过度。算法会用资源去探索更好的结果，而不是浪费在显著差的实验中。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。