常用数据分析模型与方法
在进行数据分析过程中,通常需要使用各种模型来证明自己的分析观点,一是为了使自己的结论更具备说服力,二是让自己的论证过程更具备逻辑性和条理性。
FineBI 推出部分数据分析方法,帮助用户更好的使用 BI 进行数据分析。
分析类型 | 模型/方法 |
---|---|
对外用户分析 | RFM 分析 |
对外用户分析 | ABC分析 |
对外用户分析 | 波士顿矩阵图 |
对外用户分析 | 购物篮分析-关联规则 |
对外用户分析 | 留存分析 |
对外用户分析 | 用户画像分析 |
对外用户分析 | 月复购分析 |
对外用户分析 | AARRR |
对外用户分析 | 用户运营分析 |
对外用户分析 | 用户流入流出分析 |
对外用户分析 | 用户生命状态分析 |
对外用户分析 | 用户粘性分析 |
内部营运分析 | 需求分析方法-KANO模型 |
内部营运分析 | 杜邦分析 |
内部营运分析 | 盈亏平衡分析 |
1. RFM分析
1.1 概念
RFM 分析是美国数据库营销研究所提出的一种简单实用客户分析方法,发现客户数据中有三个神奇的要素:
- 最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
- 最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
- 最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。
这三个要素构成了数据分析最好的指标。
1.2 解决的问题
RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。
1.3 预期效果
RFM 分析后,将客户划分为了不同分类,数据分析效果如下图所示:
1.4 实现思路
创建分析主题对原始数据进行加工。实现思路如下图所示:
1)创建分析主题,选择 RFM 分析所需字段。
2)对数据进行加工,求得 3 个关键指标及其平均值。
3)通过和平均值比较,向量化三个指标。
4)根据特征向量客户分类。
2.5 划分客户类型
已经得到客户的特征向量值,根据以下表格可将客户划分分类
客户特征 | 客户分类 |
---|---|
重要价值客户 (111) | 最近消费时间近、消费频次和消费金额都很高(VIP) |
重要发展客户(101) | 最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展。 |
重要保持客户(011) | 最近消费时间较远,消费金额和频次都很高。 |
重要挽留客户(001) | 最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当基于挽留措施。 |
一般价值客户(110) | 最近消费时间近,频率高但消费金额低,需要提高其客单价。 |
一般发展客户(100) | 最近消费时间较近、消费金额,频次都不高。 |
一般保持客户(010) | 最近消费时间较远、消费频次高,但金额不高。 |
一般挽留客户(000) | 都不高。 |
2. 帕累托分析
1)概述
- 帕累托分析又叫 ABC 分析,分类的核心思想:少数项目贡献了大部分价值。
- ABC 分类法全称应为 ABC 分类库存控制法。又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、ABC 管理法,平常也称之为「80 对 20」规则。
ABC 分类 | |
---|---|
A 类物品非常重要 | 数量占比少,价值占比大 |
:B 类物品比较重要 | 没有A类物品那么重要,介于 A、C 之间 |
:C 类物品一般重要 | 数量占比大但价值占比很小 |
分类的核心思想:少数项目贡献了大部分价值。
以款式和销售量为例:A 款式数量占总体 10% ,却贡献了 80% 的销售额。
注:二八分析与 ABC 分类法大致相同,都是少数项目贡献了大部分价值。不同之处是ABC 分类法将对象分三类,而二八分析则为 A、B 两类,A
类品牌商品占总体的一小部分,贡献了 80%的销售额。
把产品或业务分为A、B、 C三类,用于分清业务的重点和非重点,反映出每类产品的价值对库存、销售、成本等总价值的影响,从而实现差异化策略和管理。
2.2 解决的问题
根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式。它把被分析的对象分成 A、B、C 三类,三类物品没有明确的划分数值界限。
2.3 预期效果
在「商场销售帕累托分析」的组件「商品销售帕累托图」中,可以查看各品牌商品销售额及对应的销售额累计占比。根据 ABC 分析法,将品牌商品按销售量降序排列,依次分成销售额占比为 80% ,10%,10% 对应 A 类, B 类, C 类三类品牌,用不同颜色的柱形图展示出来,如下图所示:
2.4 实现思路
创建分析主题对已有的数据进行数据加工或者在组件制作时利用公式添加计算指标,求出累计占比指标,并在制作组件时,根据累计占比将对象进行 ABC 占比划分(二八分析则将对象进行二八占比划分),最后通过不同颜色的柱形图体现分析结果。数据处理思路如下图所示:
实现 ABC 占比划分的关键是求出「累计占比」指标,再根据累计占比指标进行划分。本文介绍了两种方法求累计占比。
示例一:是在仪表板内通过添加计算指标,使用公式进行数据加工的出「累计占比」指标。
示例二:直接在主题数据中计算得出「累计占比」指标。得出的指标可方便在多个组件中反复使用。
2.5. 结论分析
创建仪表板得出以下结论:
品牌名称 | 商品品牌数量占比 | 商品品牌销售额占比 | |
---|---|---|---|
A 类品牌 | ZIPPO(之宝)、PAW IN PAW、NEW BALANCE(新百伦)、HANG TEN | 40% | 80% |
B 类品牌 | SINOMAX(丝梦露)、O.C.T.MAMI(十月妈咪) | 20% | 10% |
C 类品牌 | WHO.A.U、RACB JJQN、LESPORTSAC、X.ZHINING | 40% | 10% |
3. 波士顿矩阵
1)概述
波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构。
波士顿矩阵将产品类型分为四种,如下图所示:
3.2 解决的问题
波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构
3.3 实现思路
通过设置警戒线,将区域分成四块象限,进而观察数据。
同时设置钻取目录,挖掘更细粒度的数据。
3.5. 结论分析
根据散点图,可以大致分析出这个公司的客户画像:
- 消费次数超过平均值,每次消费力度也超过平均水平的客户:判定为明星客户,这类客户需要重点关注,并给予最高的礼遇;
- 消费次数超过平均值,但每次消费力度未达到平均水平的客户:被判定为现金流客户,这类客户通常消费频次比较频繁,能给企业带来较为稳定的现金流,这类客户是企业利润基石;
- 消费未达到平均值,但每次消费力度超过平均水平的客户:是问题客户,这类客户最有希望转化为明星客户,但是因为客户存在一定的潜在问题,导致消费频次不高,这类客户需要利用客服进行重点跟进和长期跟踪;
- 消费未达到平均值,消费力度也未达到平均水平的客户:属于瘦狗客户,这类客户通常占企业客户的大多数,只需要一般性维护,不需要投入重点维系。
4.购物篮分析
1. 概述
1.1 概念
通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。
使用本文可计算出「提升度」,若提升度>1,则证明两种商品关联度高,两种商品的组合方式有效,可以考虑放在一起售卖。
注:本文计算中的左右合并会产生笛卡尔积,造成数据里 N 倍膨胀,建议用户在实际使用时取小部分数据进行购物篮分析,以免造成数据过量膨胀。若需要对较多数据进行商品关联分析,建议使用:购物篮之计算连带率
1.2 解决的问题
找出顾客购买行为的模式:
比如用户买了A商品,是否会对B商品产生什么影响?
不同的用户是否具有不同的购买模式?
哪些产品应该放在一起进行捆绑销售?
1.3 预期效果
1.4 实现思路
关联分析由以下指标进行衡量。
定义 | 概率描述 | 举例说明 | |
---|---|---|---|
支持度 | 支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。 | 物品集A对物品集B的支持度support P(A n B) | 今天共有10笔订单,其中同时购买牛奶和面包的次数是6次,那么牛奶+面包组合的支持度就是6/10=60% |
置信度 | 置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率 | 物品集B对物品集A的置信度P(B#A) | 今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75% |
提升度 | 先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。 | L= P(A n B) /[P(A)*P(B)] | 今天共有10笔订单,购买A的次数是8,购买B的次数是6,购买A+B的次数是6,那么提升度是0.6/(0.8*0.6)>1,因此A+B的组合方式是有效的。 |
- 支持度计算公式:同时购买A和B订单数/总购买订单数
- 置信度计算公式:同时购买A和B订单数/购买A的订单数
- 提升度计算公式:支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))
需求分析方法-KANO模型
1. 概述
1.1 背景
李雷同学作为一个产品,经常会遇到非常多的产品需求, 开发同学忙的不可开交, 用户又似乎什么都想要。开发产品资源有限,怎么才能捞出真正的用户需求?给真正重要的需求高优先级?
李雷决定引进「KANO模型」,进行系统的需求梳理,对需求进行分析和提炼,提高效率。
1.2 分析过程
KANO模型:是对用户需求分类和优先排序的有用工具,以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。
李雷对约 100 个用户进行了调研,使用 KANO 模型绘制出四象限图,如下图所示:
四个象限对应了四种需求类型,它们的优先级排序为:必备型需求>期望型需求>兴奋型需求>无差异需求。
- 必备型需求(必须有):即常说的痛点。对于用户而言,这些需求是必须满足的,理所当然的。当不提供此需求,用户满意度会大幅降低。这类是核心需求,也是产品必做功能。
- 期望型需求(应该有):当提供此需求,用户满意度会提升;当不提供此需求,用户满意度会降低。通常作为竞品之间比较的重点。
- 兴奋型需求(可以有):惊喜型产品功能,超出用户预期,往往能带来较高的忠诚度。不提供也不会降低用户满意度。
- 无差异需求(可以没有):用户根本不在意的需求,对用户体验毫无影响。尽量规避做此类型功能。
1.3 分析结果
李雷将自己做好的仪表板分享给了同事,并决定此次功能更新增加「功能2、功能3、功能5、功能8」。有了数据支撑,大家都很认同他的决定,罕见的没有出现以往为增加哪个功能而争得不可开交的局面,提升了效率。
6.杜邦分析
1.1 概念
杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效。
其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
1.2 预期效果
详情仪表板请参见:杜邦分析 。用户可点击链接另存仪表板查看仪表板的操作。
某企业 2016 年的财务状况如下图所示:
1.3 实现思路
净资产收益率=销售净利润率资产周转率权益乘数
净资产收益率受三类因素影响:
指标 | 说明 |
---|---|
销售净利润率=净利润/销售收入 | 表明企业的盈利能力 |
资产周转率=销售收入/总资产 | 表明企业的营运能力 |
权益乘数=总资产/净资产(权益)=1/(1-资产负债率) | 财务杠杆:用权益乘数衡量,表明企业的资本结构 |
盈亏平衡分析
1. 概述
1.1 背景
盈亏平衡分析又称保本点分析或本量利分析法,是根据产品的业务量、成本、利润之间的相互制约关系的综合分析,用来预测利润,控制成本,判断经营状况的一种数学分析方法。
张铭是一名服装电商行业的负责人,去年经营情况不佳。张铭希望通过盈亏平衡分析分析控制各项成本的投入,从而使店铺经营利润能达到一个新台阶。
1.2 分析方法
- 【总成本=固定成本+变动成本】【利润=月销售额-总成本】
- 固定成本:在一定范围内不随销售额的增减而变动的成本,例如:房租、水电、人工费等。
- 变动成本:指随销售额的增减大致成正比例关系变化的成本,例如:销售提成,商品进货成本等。
张铭只需要在红色区域填入去年各项成本指标,如下图所示:
可见去年店铺的盈利为负,以目前各项成本的支出,若要达到盈亏平衡,月销售额需要达到「3509091」
1.3 分析结果
原因分析:
- 固定成本高,一件商品不卖每月就需要花费 193000 元;
- 变动成本高,每销售一块钱获得的毛利润低;
- 盈亏平衡销售额=固定成本/每销售一块钱的毛利润,分子高分母低,所以盈亏平衡要达到的销售额很高。
解决方法:
- 降低固定成本:电商主要的租金为仓库,可以寻找便宜的仓库更换当前租金高的仓库;
- 降低变动成本:将定价比例降到 0.65 ,如此商品定价不会提高很多引起客户反感。
- 寻找折扣与利润之间的平衡关系:虽然加大折扣力度会提高成本,但是会带来销售量销售额的提升。张铭可以对照去年折扣与销售额的关系,通过仪表板计算得出利润最高的折扣,为今年大促活动提供参考。
手动调整各项成本参数,获得最合理的成本投入方式。