A/B-Test （Overlapping Experiment Infrastructure: More, Better, Faster Experimenta）

kennyadelaide

已于 2022-05-09 10:31:20 修改

阅读量737

点赞数

分类专栏：推荐系统文章标签：推荐系统

于 2022-05-09 10:26:52 首次发布

本文链接：https://blog.csdn.net/qq_17674161/article/details/124659865

版权

推荐系统专栏收录该内容

13 篇文章

订阅专栏

本文针对上周的工作进行了总结，上上周的工作将在接下来通过文章进行总结，主要内容为DEIN 模型。

为了解决推荐算法基于web实验的模型验证，我参考了Overlapping Experiment Infrastructure: More, Better, Faster Experimentation 2010 的google 这篇文章。

这篇文章针对当时的web验证方案进行了总结，并未google 的web实验验证方案的设计提供了参考，在此基础之上，google 工程师设计了自己的验证方案，我将对相关的工作做概要性的简述。

首先从图1 出发：

这篇文章中提出了一个数据流通道的简易路径，主要由两个server（search ，ads）组成，前者构成了数据通道的前向，后者提供了后项， web server 为推荐的可执行容易，一般来说数据并发量巨大可以采用evpp c++ web 容器，如果访问并发量不大可以采用轻量级的web容器，例如flask。前者有着诸多优势，且支持多线程。后者开发容易，部署简单。

query中包含一些重要的参数：userid， feature conbination subsets ， cookie（google 特有，实际的参数是否带用根据具体的实际情况）。

有了基本的流程之后，我们进去图3观察：

作者认为实验分为对照性实验以及单因素实验和多因素实验，实验所需要的样本以及参数需要通过对样本进行分流分桶以及进行实验参数的配置。图三主要展示了作者针对实验流量的分流。

作者引入了cookie 的概念，作者认为cookie是唯一的，可变的。且作为用户的唯一标识符。实际上在我们的系统中由于做不到google那样的庞大，可以采用数据库中的唯一字段，或者根据索引策略去实现。也可以将cookie与用户的数据库id相对应。google 工程师对于分流增加了两个策略：

1 ，求mod策略。

2，随机策略。

原文如下所示：

假设存在两个对照实验组：实验组named 实验1，对照组named 实验2. 我们对新进入的userid进行mod/2 为偶数则进入实验1，作为实验1 的样本，mod/2 为奇数，作为实验1 的样本。这里新进入的样本进行随机可能会产生两个问题（样本缺乏以及样本偏值的问题），我们的目标就是确定一个实验可变参数，其他参数保持一致，在此前提下进行对照实验。相关原文在第二部分的RELATED WORK中可以查询。如下所示：