浅谈ABtest

李晓闹

已于 2024-01-30 09:42:30 修改

阅读量306

点赞数 1

文章标签： ab测试人工智能

于 2024-01-29 11:14:48 首次发布

本文链接：https://blog.csdn.net/qq_40843166/article/details/135906820

版权

在互联网公司中，A/B 测试是验证新模块、新功能、新产品是否有效，新算法、新模型的效果是否有提升，新设计是否受到用户欢迎，新更改是否影响用户体验的主要测试方法。在机器学习领域中，A/B 测试是验证模型最终效果的主要手段。

需要进行在线A/B测试的原因如下。

（1）离线评估无法完全消除模型过拟合的影响，因此，得出的离线评估结果无法完全替代线上评估结果。
（2）离线评估无法完全还原线上的工程环境。一般来讲，离线评估往往不会考虑线上环境的延迟、数据丢失、标签数据缺失等情况。因此，离线评估的结果是理想工程环境下的结果。
（3）线上系统的某些商业指标在离线评估中无法计算。离线评估一般是针对模型本身进行评估，而与模型相关的其他指标，特别是商业指标，往往无法直接获得。比如，上线了新的推荐算法，离线评估往往关注的是ROC曲线、P-R曲线等的改进，而线上评估可以全面了解该推荐算法带来的用户点击率、留存时长、PV访问量等的变化。这些都要由A/B测试来进行全面的评估。

在数据分析过程中，ABtest是常用到的策略或统计方法，主要用来比较不同质人群对同一营销活动，或者同质人群对不同产品功能的青睐程度，通过结果指标来反馈这一影响的方法。具体过程如下：
1）确定目标：确定要测试的目标和衡量标准，例如点击率、转化率等。
2）划分样本：随机将目标群体分为多个组，如A组和B组。
3）实施变化：对不同组应用不同的设计、策略或变化。
4）收集数据：收集每组的表现数据，比如点击量、销售额等。
5）分析结果：通过统计学方法和假设检验来比较不同组的表现，确定哪种设计或策略更有效。
ABtest过程中需要注意的点有很多，因为直接关系到策略是否有效，能否进行放量，因此需要充分的论证来说明策略的有效性
1、指标的确定。
ABtest最重要的就是评估指标的确定，一般会包括结果指标和过程指标。结果指标很好理解，策略要提升的目标指标可直接作为ABtest的结果指标。如转化率，GMV，GTV，点击率、成交率等。但除此之外还需要过程指标来整明结果指标是策略带来的提升。如在以成交率作为最终的结果指标时，需要曝光率，曝光点击率等中间过程指标来支持策略的有效性
2、样本确定
在做ABtest的过程中，样本的选择至关重要，直接关系到最终的策略结果。一般样本选择是随机抽样，但是中间会出现一个问题，那就是做ABtest之前需要做一个AAtest测试，测算过程中减去自然情况下的两组人群差异，即使是同一人群也很难保证AB和AA之间的表现完全一致，因此这时候需要延长实验周期，或者采用抽样的方式，对AB或者AA的人群进行抽样，尽可能的用相同表现的人群测算实验效果。如果以上办法依旧不能判断策略是否有效，那这时候还可以选择反转实验组人群和对照组人群，观测实验差异，但这个过程中，产品样式等相关策略不适用，因为同一人群不同时间面对不同产品样式容易引发客诉
3.实验方式
AB实验的方式有很多种，一般分为客群AB，时间AB（隔日AB，同样的客群，第一天实验组，第二天对照组…），隔日半日AB（第一天上午实验组，下午对照组，第二天上午对照组，下午实验组…）等方式