秦路《七周成为数据分析师》学习笔记,供自己学习查看使用,侵删。
目录
象限法
常见用途:
用户分群:用户价值与用户流失度两个维度进行划分,能使用户群体被划分得很清晰。
RFM模型:
根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:
- 最近一次消费时间(Recency)
- 消费频率(Frequency)
- 消费金额(Monetary)
在这个模型中,时间占据着很重要的角色。
在不同的业务背景之中,不同的维度有着不同的重要性。比如获取一个用户的成本非常高,那我们通常会给“最近一次消费”更多的权重,因为我们非常关注客户流失率。
核心 所划分出的范围分别对应不同策略。
优点 直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略。
应用 适用范围广、戓略分析、产品分析、市场分析、客户管理、用户管理、商品管理等。
划分标准具体情况具体分析。
多维法
核心 精细驱动
优劣 处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间
应用 只要数据齐全且丰富,均可以应用
注意 多维情况下常常会出现辛普森悖论。
辛普森悖论:
在分组比较中都占优势的一方,在总评中有时反而是失势的一方。产生原因往往是各分组的数据量相差较大。
解决方式:钻取(将维度进一步拆分)
假设法
例 1
公司在节日进行了一次营销活劢,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节日而提高,那么怎么证明活动是有效或者无效的呢?
假设嘉伦成功带货。那么会发生什么事情?(任嘉伦感CAFE代言活动)
- 会有一定数量的任嘉伦粉丝购买,如果能证明这条,那么我们有理由相信活动是有效的。
- 粉丝因为嘉伦购买咖啡,会发生什么可观测的行为呢?—— 商品评价中提及嘉伦。
- 当粉丝提及了嘉伦,接下来的问题是,在本来就因为节日而提高销量的情况下,嘉伦的贡献在销售增长中占了多少?
- 假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比(或转化率),反推出粉丝购买人数,再和总的销量增长做对比,就可以得知嘉伦究竟为雀巢带货提高了多少。
(个人认为,这个分析是站在第三方的立场的(或竞争厂家想打探消息),因为厂家怎么可能没有卖出去多少件的数据呢,何必通过评论量进行粗浅估算……而且,以上假设了不论是否是粉丝,写评价的几率是一样的,但实际上粉丝买了的话八成会写评价,而普通消费者买东西不评价是很正常的。或者用在促销折扣/买赠这种活动上更为合适,此处只是一个嘉伦粉丝为了加深记忆而自己套上的场景哈哈~)
- 假设商品提价后,销量一定会下跌,问题是销量下跌多少?
- 首先假设流量不会有变化(流量和渠道营销正相关),商品价格只影响转化率,那么现在确定转化率的波动。
- 找出平时的转化率(譬如为20%,100个人浏览时有20个人会购买),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚XX、普通XX、羊毛XX…
- 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化(变为0)…这些数据可以凭借经验做出假设。最后汇总。
积累:对于商品价格改变不改变流量,只影响转化率;估计转化率变化时分用户类型讨论。
核心 启发性思考驱动
优点 当没有直观数据、线索分析时,以假设先行的方式进行推断,这是一个论证的过程。
应用 更多是一种思考方式,假设—验证—判断。
须知 不只可以假设前提,也能假设概率或者比例,一切都能假设, 只要自圆其说。
指数法
指定一个标准来衡量热度等。比如说爱奇艺剧播指数……周生如故一生一世给我冲!!
回到正题咳咳,其实就是加工原始数据→目标指数。就是以前数学建模你总干的事。
核心 目标驱动的思维
优点 目标驱动力强,直观、简洁、有效。对业务有一定的指导作用。
应用 无法利用数据而将其加工成可利用的。
须知 没有统一的标准,很多指数更依赖经验的加工。
常用方法:
1.线性加权。不赘述。
2.取倒数。如计算用户忠诚度,每月买了几次,买的次数越多可能忠诚度更高,但是!——买1次和买两次在忠诚度上有很大的差别,而买50次和买100次就不差啥了。——采用倒数,令y=1-1/x,这样可以把数值小时的差异放大而把数值大时的差异缩小。
3.同理可以取log。
二八法
数据中,20% 的变量将直接产生80%的效果,数据分析更应该围绕这20%作文章。
虽然指标很多,但往往某些指标更有价值,二八法则不仅能分析数据,也能管理数据。
(持续关注TopN的数据是一个非常好的习惯!)
核心 只抓重点的思维
优点 和业务紧密相关,和KPI更紧密相关。花费很少精力就能达到不错的效果,性价比很优
应用 存在于几乎所有的领域,所以这种分析思维没有局限。
须知 在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘
对比法
节日大促,女生消费占比从60%变为70%,女生节日爱消费?
这个结论是有问题的!
占比提高了,不代表绝对值提高了。某商品平时销售额100万女生占60万,节日销售额80万女生占56万:竞争对手节日做了超大的促销活动,节日销售额降低了……
![](https://i-blog.csdnimg.cn/blog_migrate/2ce32649fde1a13a6162a3f9f61503a1.png)
核心 挖掘数据规律
优点 对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,
比如多维对比、象限对比、假设对比等
应用 一次合格的分析,一定要用到n次对比
漏斗法
核心 流程化思考方式,清楚看到流程各步骤中的转化率
应用 涉及到变化和流程的都能用。
须知 要和其他分析思维结合,比如多维,比如对比。单一的漏斗分析得到转化率没有用~