用python分析数据案例_使用Python完成《数据分析实战》中的案例-3

最新推荐文章于 2023-09-21 16:54:26 发布

weixin_39728572

最新推荐文章于 2023-09-21 16:54:26 发布

阅读量360

点赞数

本文链接：https://blog.csdn.net/weixin_39728572/article/details/111438693

版权

用python分析数据案例

A/B 测试哪种广告的效果更好

现状与预期

促销活动的购买率低

通过和其他应用的促销活动相比较，我们发现《黑猫拼图》游戏的促销活动的购买率确实偏低。因此，我们希望能够通过数据分析找出购买率偏低的原因，改善这种状况。

整理现状和预期

现状：和其他应用的促销活动相比，《黑猫拼图》的游戏装备促销活动的购买率偏低。

预期：弄清楚购买率偏低的原因，并确保和其他应用的促销活动有相同的购买率。

发现问题

和其他应用有何不同

为明确现状与预期之间的差距，我们需要从大的视角出发来考虑《黑猫拼图》游戏和其他应用有何不同，并尝试做出假设。

1. 游戏装备促销活动的内容有问题

→ 销售的游戏装备并不是用户需要的

→ 销打折的力度不够，对用户没有太大吸引力

2. 广告的外观展示有问题

通过咨询了游戏的策划部门，并统计了在促销期间出售的游戏装备的使用情况，得到了如下反馈。

游戏装备促销活动中出售的游戏装备或许能够用得上

和其他应用一样，促销时的游戏装备打五折，这从用户的立场来看是很划算的

也就是说，上述第 1 个假设中的问题基本不大。通过咨询了市场营销部门，得到：

游戏装备大促销的广告都是由各个应用的设计师负责的，所以广告的质量也是参差不齐

《黑猫拼图》游戏的广告的点击率一直比较低(参考下表)

数据的收集和加工

探讨验证方法

问题

→《黑猫拼图》游戏的广告点击率比其他应用低 (事实)

→《黑猫拼图》游戏的广告设计有问题 (假设)

解决方案

→ 用点击率高的广告替换目前所使用的广告 (解决方案)

为了完成上述方案，需要找到哪种广告更容易被点击。但是，在《黑猫拼图》游戏中，之前每月开展的“游戏装备大促销”活动的广告一直都没有变更过，因此我们缺少可供分析的数据。

于是，我们准备了两个不同的广告，通过收集数据来比较哪个广告更容易被用户点击。

如果采用前后比较的方法，则无法排除外部因素的干扰

如下图所示，在前一段时间内投放广告A ，在后一段时间内投放广告B，并比较前后两个时间段广告投放的效果。其思路是“如果继续投放广告A，购买率应该是这样”，然后拿这个值和广告 B 的值进行比较。然而，这种做法却存在外部因素干扰。比如说：A广告投放时间结束后，改投放B广告，在此期间，购买率得到提升，是因为B广告奏效呢？还是A广告效应延迟的结果。这是难以证明的。

采用A/B测试的方法排除外部因素干扰

A/B 测试能够在多个选项中找出那个能够带来最佳结果的选项。例如，如下图所示，我们只要同时投放广告 A 和广告 B，就可以排除之前所说的外部因素的干扰。

A/B 测试虽然在引入时需要较高的开发成本，但是实施成本却相对较低，而且也方便收集统计数据，因而在互联网业界被广泛使用，此外在部分广告业和制造业中也会被采用。

● A/B测试中的用户分组必须遵循随机的原则

要想避免条件性的差异，最简单的一种分组方法就是把用户 ID 对某个数进行取模运算。

● 同时进行多个A/B测试时的陷阱

A/B 测试是将测试对象随机分为 A、 B 两组，然后比较两组之间差异的验证方法，但是有的企业会在同一时间开展多个 A/B 测试。在这种情况下，就算这些 A/B 测试各自使用了上述方法来对用户进行分组，彼此之间仍有可能相互干扰。如：① 所有的 A/B 测试都采用相同的分组方法；② 各组中参与其他测试的用户比例不同。

利用统计学上的假设检验来过滤

不光是在 A/B 测试中，平时当我们需要判断两组之间是否存在差异时，都可以用到统计学上的“假设检验”。

众所周知，偶然的行为(异常值)在用户数较少的情况下，某一个用户的偶然行为都可能对结果造成较大的影响。但当用户数增多时，这种影响就会逐渐消失。因此，使用假设检验时，人数越多，越容易得出“存在显著性差异”的结论。然而，即使“存在显著性差异”，这种差异在商业领域也未必有意义。尤其是在大数据盛行的现在，由于数据量的增大，假设检验中“用户数较少导致的偏差”已经很小了，因此我们很难再断言“不做假设检验就不知道是否存在显著性差异”的那些差异还有意义。

尽管如此，万一出现了“看上去像是有差异，而实际上不是显著性差异”的情况还是很麻烦的，因此我们需要通过假设检验来过滤出显著性差异。这里并不是说只要“通过假设检验找出差异”就可以了，而是要“先通过假设检验找出有统计意义的差异，再探讨这个差异在商业活动中是否有意义”。

收集和加工验证所需要的数据

A/B测试的日志输出

ab_test_imp(关于广告曝光次数的信息)

ab_test_goal(关于广告点击次数的信息)

查看数据结构并检查是否存在缺失值

分析前的数据加工

● 广告的曝光次数信息和点击次数信息合并起来

● 生成一个新的标志位来标识该条记录是否被点击

数据分析

弄清楚 A 和 B 的点击率是否存在显著性差异

统计一下A和B两个广告的点击率，以确定哪个广告的效果更好。

观察 A 和 B 的点击率，我们发现 A 的点击率为 0.08026，大约是8%，而 B 的点击率为 0.11546，大约是 12%。在探讨这二者的差异之前，首先需要对其进行假设检验。像本例这样，针对两种广告点击情况的差异来进行假设检验，一般采用的是卡方检验。

在本例中，计算出来的结果，卡方值308.38，P值4.93e-69，自由度1；由于 p 值非常接近于 0，因此我们可以说：在将两种广告分为 A 和 B 并同时投放后，所得到的点击率存在显著性差异。

广告 A 和 B 的点击率的时间序列变化的可视化

在确认了二者“存在显著性差异”后，我们再来看这种差异在商业领域里是否有意义。在本例中，原来广告的点击率只有 6%，而其他应用的广告的点击率为12%。为了填补这个差异，我们进行了测试。通过观察结果可以发现广告 B 的点击率达到了大约 12%，基本上达到了我们的目的，因此在商业领域里这也是一个有意义的差异。最后，我们再确认一下点击率的时间序列变化情况。在时间序列图中，如果广告 B 的效果始终都比广告 A 好的话，那就没有问题，但是如果只是在某个时间段内广告 B 的效果更好，那就需要考虑是否存在别的原因了。

通过上图可知，广告 B 的点击率在大多数时候都优于广告 A。所以总的说来，广告 B 的效果始终都比广告 A 好。

解决对策

分析的结果是，广告 B 比广告 A 更容易被用户点击，因此我们需要在《黑猫拼图》游戏里投放广告 B。今后，我们可以继续通过这种 A/B测试的方式来找到最合适的广告。

weixin_39728572

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用python分析数据案例_使用Python完成《数据分析实战》中的案例-3

A/B 测试哪种广告的效果更好现状与预期促销活动的购买率低通过和其他应用的促销活动相比较，我们发现《黑猫拼图》游戏的促销活动的购买率确实偏低。因此，我们希望能够通过数据分析找出购买率偏低的原因，改善这种状况。整理现状和预期现状：和其他应用的促销活动相比，《黑猫拼图》的游戏装备促销活动的购买率偏低。预期：弄清楚购买率偏低的原因，并确保和其他应用的促销活动有相同的购买率。发现问题和其他应用有何...
复制链接

扫一扫