阅读之前看这里
👉:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址: 天阑之蓝的博客
,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。
统计学的知识,学了那么多,应该在实际问题去验证和解决,尽量在实际项目中去应用,要有输出的环境,否则学习只是学习,并不能检验真正的水平和意义。所以针对此,后续在网上找一些案例进行实操。
案例1
例1:某互联网公司希望激活数量可观的沉默用户,设计了3个方案,将所有沉默用户随机分布在规模相同的三个群中,将3套方案实施在这3个群体中,观察3个群体中每天成功唤醒的用户数量,下图是3个方案实施8天后的数据:
那么作为数据分析师,要如何依据上面的数据衡量每个唤醒方案的效果,选出最优方案呢?这个问题结合业务的分析,还是可以实现的。但是这里主要结合基本的统计学知识来做基本的分析。
分析方法有哪些呢:
我们 先假设这3个方案的用户激活数的均值是相等的 。我们需 要通过统计学的方法来验证这个假设是否正确
,如果满足这个条件,则接受这个假设,说明这3个方案的效果是相同的,如果不满足一定的条件,就拒绝这个假设,说明这个3个方案激活效果是不一样的,那么才有接下来的深层分析。
这里我们对这3个方案的数据做了单因素方差分析:
STEP1 :在EXCEL2019中工具栏中选择数据,然后选择数据分析
STEP2 :选择单因素方差分析
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200