数据分析方法(二)

5、假设检验法

针对某项问题,提出假设是这个原因造成的,然后搜集数据来证明自己的假设,最后得出结论,这种方法比较适合业务问题的分析,也叫归因分析。

假设检验法的流程是:

提出假设

搜集证据

得出结论

可以使用三个方法来客观地提出假设,同时防止遗漏假设。

(1)从用户(运营部),产品(产品部),竞品(市场部)这三个维度提出假设;

(2)从 4P 营销理论提出假设;

产品 product:公司提供给目标市场的有形或无形的产品,包括产品实体、品牌、包装、样式、服务、技术等。

价格 price:用户购买产品时的价格,包括基本价格、折扣价格、付款期限及各种定价方法和定价技巧等。

渠道 place:产品从生产公司到消费用户所经历的销售路径。

促销 promotion:是指企业利用各种方法刺激用户消费,以此来促进销售的增长。包括广告、人员推销、营业推广等。例如买一送一、过节打折的。

(3)从业务流程提出假设。

下面通过一个例子,我们来阐述假设检验法如何使用

某款商品销量上升了?分析一下原因

(1)从产品 渠道 运营三方面的去大胆提出假设

(2)从4P营销理论去提出假设

我们先大胆提出假设,然后通过搜集证据,也就是找相关数据去证实,若证实成功,则代表假设成立,反之亦然。

总结:

假设检验法是针对某个问题,根据一些因素大胆提出自己的假设,然后通过搜集数据,去分析证明自己的假设,若成立,则可得出相应的结论,若不成立,则可排除该因素。

使用假设检验法,可以极大的提高我们的逻辑推理能力,主要用于归因分析。我们可以把每个问题当成需要攻克的案件,查到真凶才是真正目的(找到出现问题的根本原因),不断提出假设,不断去层层剖析。

假设检验分析法是一种分析思路,假设检验法往往需要配合其他分析方法联合使用,例如多维度拆解和对比分析。

6、相关分析法

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析(官方定义)

简单来说, 相关性的方法主要用来分析两个东西他们之间的相关性大小

相关性大小用相关系数r来描述,关于r的解读:(从知乎摘录的)

(1)正相关:如果x,y变化的方向一致,如身高与体重的关系,r>0;一般地,

·|r|>0.95 存在显著性相关;

·|r|≥0.8 高度相关;

·0.5≤|r|<0.8 中度相关;

·0.3≤|r|<0.5 低度相关;

·|r|<0.3 关系极弱,认为不相关

(2)负相关:如果x,y变化的方向相反,如吸烟与肺功能的关系,r<0;

(3)无线性相关:r=0, 这里注意, r=0 不代表他们之间没有关系, 可能只是不存在线性关系。

 实战案例 问题:影响B 站留存的相关的关键行为有哪些?这些行为和留存哪一个相关性是最大的?

分析思路: 

1、找全与留存相关的行为

2、计算这些行为和留存的相关性大小

首先规划好完整的思路, 哪些行为和留存相关, 然后利用这些行为+时间维度组成指标,因为不同的时间跨度组合出来的指标, 意义是不一样的, 比如登录行为就有7天登录天数,30天登录天数

第二步计算这些行为和留存的相关性, 我们用1 表示会留存 0 表示不会留存那么就得到 用户id + 行为数据+ 是否留存 这几个指标组成的数据然后就是相关性大小的计算

相关分析注意事项

如果A和B相关,有至少五种可能性:

A导致B

B导致A

C导致A和B

A和B互为因果

小样本引起的巧合

总结:

相关分析是判断两个或两个以上变量之间是否存在某种联系

在工作中,我们经常使用相关分析来判断产生某个问题的影响因素,利用相关系数的大小进行相关性强弱的判断,用客观的数字来呈现变量之间的关系,也不是凭经验,凭直觉。

但是要避免一个误区,相关关系并不一定是因果关系,因此在进行相关分析时除了看相关系数大小外,还要进一步验证,如果其他因素不变,该变量是否能够引起另外一个变量相应的变化。

7、TGI指数分析

TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。TGI指数是反应偏好的一种指标

TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例  * 标准数100

TGI计算公式中,有三个关键点需要进一步拆解:某一特征,总体,目标群体

随便举个栗子,假设我们要研究A公司脱发TGI指数:

某一特征,就是我们想要分析的某种行为或者状态,这里是脱发(或者说受脱发困扰)

总体,是我们研究的所有对象,即A公司所有人

目标群体,是总体中我们感兴趣的一个分组,假设我们关注的分组是数据部,那目标群体就是数据部

于是乎,公式中分子“目标群体中具有某一特征的群体所占比例”可以理解为“数据部脱发人数占数据部的比例”,假设数据部有15个人,有9个人受脱发困扰,那数据部脱发人数占比就是9/15,等于60%。

而分母“总体中具有相同特征的群体所占比例”,等同于“全公司受脱发困扰人数占公司总人数的比例”,假设公司一共500人,有120人受脱发困扰,那这个比例是24%。

所以,数据部脱发TGI指数,可以用60% / 24% * 100 = 250,其他部门脱发TGI指数计算逻辑是一样的,用本部门脱发人数占比 / 公司脱发人数占比 * 100即可。

TGI指数大于100,代表着某类用户更具有相应的倾向或者偏好,数值越大则倾向和偏好越强;小于100,则说明该类用户相关倾向较弱(和平均相比);而等于100则表示在平均水平。

刚才的例子中,我们瞎掰的数据部脱发TGI指数是250,远远高于100,看来搞数据的脱发风险极高,数据才是真正的发际线推手。

结论:

① TGI指数 >100,说明该组用户更具有某类偏好(高于平均水平),TGI指数越高即偏好性越强

② TGI指数 <100,说明该组用户更不具有某类偏好(低于平均水平),TGI指数越低即偏好性越弱

③ TGI指数 =100,说明该组用户的某类偏好处于平均水平

  1. 留存分析 

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

按照不同周期,留存率分为三类:

第一种是日留存,日留存又可以细分为以下几种:

次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;

第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;

第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;

第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;

第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。

第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。

留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。

下面以月留存为例生成的月用户留存曲线:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值