几种常见的数据分析方法拆解_切片数据和漏斗数据-CSDN博客

本文链接：https://blog.csdn.net/weixin_41875135/article/details/122979103

数据分析一直是我们互联网人辨别方向的不二法门，我们通过对数据的观测来判断事物的发展趋势，也常常利用数据的思维来辩证的为决策做参考。

掌握技能和工具只是第一步，做好数据分析还必须要有数据分析思维。数据思维具有框架性引导作用，能够帮助确认分析角度、搭配分析方法、选择指标体系以及得出分析结论。但要明白，数据思维不是一两周就能锻炼出来的，要不断练习。

下面就给大家详细拆解几种常见的数据分析法，让我们的数据分析少走弯路。

一、象限分析法

从这张图，你能分析出来什么呢？

X轴从左到右是点击率的高低，Y轴从下到上是转化率的高低，形成了4个象限，这就是我们要说的象限分析法。

针对每次营销活动的点击率和转化率找到相应的数据标注点，然后将这次营销活动的效果归到每个象限，4个象限分别代表了不同的效果评估。

象限一：高点击高转化，点击高代表营销创意打动了受众，转化高代表被打动的受众是产品的目标用户；

象限二：高转化低点击，同样的，高点击代表被打动的受众是产品的目标用户，但低点击代表的是营销创意没有打动用户；

象限三：低点击低转化，这个象限是最糟糕的营销活动了，投放广告点击少，点击用户转化低，创意无效，用户不精准；

象限四：高点击低转化，这个象限的营销活动要给策划和文案加鸡腿，但就要给渠道扣绩效了。这种象限的营销活动一定程度上有标题党的嫌疑。

象限分析法有什么用？

1.找到问题的共性原因；通过象限分析法，将有相同特征的事件进行归因分析，总结其中的共性原因。例如案例中第一象限的事件可以提炼出有效的推广渠道与推广策略，第三和第四象限可以排除一些无效的推广渠道；

2.建立分组优化策略；针对投放的象限分析法可以针对不同象限建立优化策略，例如提升象限二的投放创意，象限四的投放渠道。

象限法是运用坐标的方式，人工对数据进行划分，从而传递数据价值，将之转变为策略。象限法应用很广泛，像RFM模型、波士顿矩阵都是象限法思维。

下面这个RFM模型就是利用象限法，将用户分为8个不同的层级，从而对不同用户制定不同的营销策略。

二、公式拆解法

什么是公式拆解分析法？

所谓公式拆解法就是针对某项指标，用公式表现该指标的影响因素，例如日销售额的影响因素是各商品的销售额，找到影响因素后，需要对影响因素的影响因素进行拆解。

看这张图，以日销售额为例做了一次公式拆解分析，这次拆解一共包括了5层，最后一层是对推广效果的衡量。

第一层：找到日销售额的影响因素

日销售额=各商品的销售额之和，也可以拆解为各渠道的销售额之和、各销售人员的销售业绩之和。公式拆解分析法的第一步是需要确定要分析的指标，然后找到这个指标的直接影响因素。

第二层：找到各商品销售额的影响因素

各商品销售额=销售数量*单价

第二层拆解需要找到影响目标指标的影响因素，例如各商品销售额的影响因素是商品的销量和单价，这里是简单举例算法，在实际分析中，还需要计算优惠政策等因素。

第三层：找到销售数量的构成因素

销售数量=店铺新客购买数量+店铺老客购买数量+复购用户购买数量

这里对销售数量的拆解是针对购买人群的特征来划分的，这样分析的目的在于找出不同客群的购买影响因素。而在实际应用中，因分析目的的不同，对指标影响因素的拆解也不同，例如销售数量可以拆解为渠道A销量+渠道B销量+渠道C销量。

第四层：找到新客的来源

店铺新客购买数量=渠道A转化新客购买数量+渠道B转化新客购买数量+渠道C转化新客购买数量+……

这样拆分的目的在于找出不同渠道来源用户的后续转化特征，从而找到购买力高的用户来源渠道。

第五层：计算渠道推广回报

渠道推广回报的计算方式就是A渠道新客销售额-推广成本。

从日销售额拆解到最后一步，是拆解出了对渠道推广效果的分析，这是对店铺新客的拆解，那么同样，也可以对店铺老客或者复购客户进行拆解，例如复购用户可以拆解出复购周期、复购次数、累计复购数量等因素，对复购用户给予特殊购买通道或提供有约束力的购买政策，例如年卡之类的。

公式拆解法是针对问题的层级式解析，在拆解之前，不能盲目拆解，需要有目的性的找方向，从而挖掘原因。例如在上文案例的拆解过程中，拆解方向可以分为两种，一种是对绩优指标的拆解，找出销售额上涨的原因，另一种是对绩劣指标的拆解，找出销售额下降的原因。

三、对比分析法

什么是对比分析法？

上面这张图表是一个常见的柱状图，而柱状图的作用在于直观对比各项数据之间的差异。

上面这张柱状图是针对9月份各渠道获客统计的一个对比分析图表，针对各渠道的下载量、访问量、注册量进行对比。

对比要点一：对比建立在同一标准维度上

在这张图中，首先要关注到的对比要点是各项数据的对比要基于同一维度。这张图是针对9月份的渠道推广效果的对比统计，9月份就是第一个对比标准，也就是时间维度。

在时间维度下，后续对比的结果都是基于这个标准产生的，也就是在9月份这个时间范围内的数据对比，并不能用10月份的数据与这个图表中的数据对比。当然，除了时间维度，也可以使用空间维度，例如渠道A在1-12月每月的数据对比。无论用什么维度，对比要建立在一个大的标准下。

对比要点二：拆分出相关影响因素

在时间这个大维度下，我们对各渠道的获客效果进行了拆分，也就是将获客效果衡量分为了访问量、下载量和注册量。这三个维度的数据作为判断渠道获客的标准，从对比中找出各渠道的优劣。

例如通过这个图表可以看出，渠道A的访问量最高，渠道B的下载量最高，渠道A的注册量最高，那么这样的对比结果能够说明什么问题呢？

我们能够看到，渠道A从访问到下载的流失比较严重，渠道B从下载到注册的流失比较严重，而渠道C在访问量、下载量都低于其他渠道的基础上，渠道C的注册量与渠道A并没有相差太多。

也就是说，我们可以提出一个假设，渠道C的获客效果更好，为了印证这个假设，我们可以在影响因素中再加入渠道投放花费这个维度，如果渠道A的高访问是因为高花费，渠道C的低访问是因为低花费，那么基本可以印证这个假设。

对比要点三：各项数据对比需要建立数据标准

在这张图中能够看到一个比较奇怪的现象，渠道B的下载量比访问量还要高，为什么会这样呢？

我们在这张图表中加入了一个中间标准数据，对各项数据进行了一次标准换算。假设访问量的真实数据为1万是，标准数据为1，下载量的真实数据为1千时，标准数据为1，注册量的真实数据为100时，标准数据为1.

经过标准数据的换算，我们将各项数据放在一张图表上时，对比的差异化会更明显。

对比分析法的维度可以分为同比、环比、定基比等不同的对比方法：对比分析在于看出基于相同数据标准下，由其他影响因素所导致的数据差异，而对比分析的目的在于找出差异后进一步挖掘差异背后的原因，从而找到优化的方法。

对比法是一种挖掘数据规律的思维，能够和任何技巧结合，一次合格的分析一定要用到N次对比。

对比主要分为以下几种：

横向对比：同一层级不同对象比较，如江苏不同市茅台销售情况。

纵向对比：同一对象不同层级比较，如江苏南京2021年各月份茅台销售情况。

目标对比：常见于目标管理，如完成率等。

时间对比：如同比、环比、月销售情况等，很多地方都会用到时间对比。

四、可行域分析

什么是可行域分析？

上方左侧图是一张福格模型的图，福格大哥将影响用户行为动机的因素拆分为MAT三个因素。

M是付出行动的动机，A是付出行动的能力，T是触发行动的条件，简单理解就是大众只对自己感兴趣并且有能力满足的事物会产生下一步行为。

比如新iphone卖1万，大多数人是买的起的，这就有了付出行动的能力，而产生行为的动机就取决于新iphone的创新能力，当乔布斯从文件袋里掏出ipad的时候，将大家的动机调动到了最高点，但价格限制了一部分人付出行动的能力。

动机越高，需要付出的能力越低，形成的有效触发区域就越广，福格模型的触发有效区，我们就将其称之为可行域。

那么可行域分析该怎么用呢？

看上方右侧图表是针对推广创意做的一次象限分析，横轴代表点击量的从低到高，纵轴代表转化率的从低到高。

而点击率代表的营销创意的有效性，转化率代表的是推广渠道的精准性，在这张图表上我们分成了4个象限，但同样是高点击、高转化的象限中，也有具体数据的差别。

首先我们看到2条红色的曲线，在高点击和高转化的区域中我们画了一条红色曲线，这条曲线上方是“高可行域”，曲线下方是低可行域；而在低转化与低点击的象限中我们也画了一条曲线，这条红色曲线的下方是最不可行域。

什么意思呢？

其实就是对点击率和转化率的高低做了一个细化分层，点击率和转化率是每一次推广创意的数据化表现，而画出一个可行域，是对营销活动的归类。

那么这条曲线到底要画在什么样的数据标签上？

这需要在实际分析工作中做总结，也就是说，可行域分析实际上是一种自己建立的数据分析模型，根据具体数据不断修正调整可行域的范围，对业务指标进行有效评价。

除了两条红色曲线外，还有两条蓝色曲线，一条是渠道可行域，另一条是创意可行域，这两条曲线是对渠道有效性和创意有效性的评价，满足相应区域条件的事件即可作为有效事件经验，为后续的运营增长提供支持。

五、二八分析法

经济学定律中说80%的财富掌握在20%的人手中，而在运营中可以发现，80%的贡献度来自于20%的用户。

这张图中体现了2个法则，也就是二八法则和长尾理论，在数据分析中，建议将这个两个理论合起来用。

但实际上呢，二八法则和长尾理论是相对的，二八法则告诉我们说，你要重视头部用户，也就是能产生80%收益的那20%的用户或商品，而长尾理论告诉我们说要重视长尾效应，也就是剩余那20%的收益。

那么在数据分析中，这两个模型要怎么用呢？

在数据分析中，二八法则和长尾理论和应用于用户分析和业务分析2个方面：

20%的头部用户：凭什么那么优秀？

在用户分析上，通过二八法则建立用户分群，将所有用户切割成一个又一个的实验组，对实验组的用户进行单体特征分析，目的只有一个，同样都是用户，凭什么你们那么优秀？

在数据分析中，单体分析与群体特征分析同样重要，然而我们不可能对上万的用户进行个体分析，可能的是对头部用户进行个体行为分析，建立群体样本。

在运营数据分析中，可以针对核心指标分别找到20%的用户：

购买数量前20%的用户

购物金额前20%的用户

日访问次数前20%的用户

访问页面数量前20%的用户

转发次数前20%的用户

……

也就是说，你想提升什么指标，就找到这个指标表现优秀的用户。那么20%的用户也很多怎么办呢？可以主动设置数据区间。

例如想要提升用户的访问时长，我们可以对头部用户的访问内容、路径进行分析找到原因，20%的头部用户访问时长从10分钟到30分钟不等，那么我们可以将头部用户的访问市场切分为10分钟、15分钟、20分钟、25分钟、30分钟，获得不同的用户组，从这个用户组中找到相应的20%的用户进行特征分析。

这里需要注意的是，同组20%用户的特征提升只对同组剩余80%的用户有效，例如访问时长10-15分钟的用户中，头部20%的用户的行为特征可以对剩余80%的用户起效，但对日访问5分钟的用户效果并不大。

20%的头部业务：带头大哥的应有觉悟

针对业务分析的目的在于找到爆款内容的特征，

例如资讯类产品中对阅读量头部文章的分析，一方面是对文章的特征进行分析，另一方面，是对阅读用户的分析。

爆款文章或商品背后，代表的是对大多数用户兴趣的满足，充分唤起了用户的行为动机，而在用户分析中，我们需要进一步找到这部分用户日常阅读的头部内容，进行特征的延展分析。

“世界上80%的财富掌握在20%的富人手里”，这句话你一定听过。这就是二八法则，也叫帕累托法则。这个方法的思维就是抓重点，围绕找到的20%有效数据，找到其特征，使之产生更大的效果。

比如一个商超进行产品分析的时候，就可以对每个商品的利润进行排序，找到前20%的产品，那这些产品就是能够带来较多价值的商品，可以再通过组合销售、降价销售等手段，进一步激发其带来的收益回报。

六、假设分析法

什么是假设分析法？

举个栗子：

“小明和妈妈买了10本书，正好花了100块钱，书的单价有8块钱和13块钱2种，那么8块钱的书和13块钱的书各买了几本？

解题思路：

首先，假设这10本书都是8块钱买的，那么10本书一共是80块钱，那还多出来20块钱，是算错账了么？不是，显然多出来那20是13块钱1本的书多出来的。13块钱的书比8块钱的书每本多了5块钱，20块钱可以买4本，那么可以得出结论了，13块钱的书有4本，那么8块钱的书有几本呢？

对了，6本。

这道6年级的数学题里就用到了假设法，假设所有书都是8块钱，那么在数据分析中，什么是假设法呢？简单理解，假设法是在已知结果数据，在影响结果的多个变量中假设一个定量，对过程反向推导的数据分析方法。

假设法在运营分析中怎么用？

假设法在运营分析中最常见的有2种场景：

场景一：已知结果找原因，做过程变量假设

例如：某内容社区在11月份的发帖数相比10月份下降了20%，针对这个结果，该如何分析原因？

面对这样一个无厘头的问题，该怎么分析呢？结果数据是发帖数下降了20%，那么影响发帖数的有哪些因素呢？

我们可以将发帖数量按照用户分层进行拆分，例如老用户发帖数量和新用户发帖数量，也可以按照具体发帖篇数进行拆分，例如发帖5篇以上的用户，发帖3-5篇的用户，发帖1-3篇的用户，拆分后将11月与10月份相同维度的数据进行对比，找出变量。

例如经过拆解后发现，发帖1-3篇的用户相比10月份减少了40%，其他篇数的用户量还高于10月份，那么问题就出在了发帖1-3篇的用户身上。

那么发帖1-3篇的用户为什么减少了呢？我们可以提出2个假设：

假设10月份发帖1-3篇的用户成长为更加活跃的用户了，造成发帖3-5篇的用户增加，1-3篇的用户减少；

假设10月份发帖1-3篇的用户流失率比较高，同时11月份新用户转化少，导致这一群组用户数量变少。

那么针对这2个假设，需要对10月份发帖1-3篇的用户与11月份发帖3-5篇及5篇以上的用户进行追踪分析，同时分析11月份新增用户与10月份新增用户在留存和活跃上的对比。

场景二：已知目标找过程，做结果假设

例如：12月份的销售KPI为1000万，环比11月份上升20%，该如何做一份销售方案？

这是在做工作计划时最常见的需求，以12月份需要达成1000万的销售KPI为例，拆分销售KPI的相关影响因素，同样有2个拆解维度：

1.从商品角度做拆分

要达成1000万的销售额，有多种假设方式，例如假设现有商品销售额与11月相同，新品销售额达到200万，那么为了实现这个结果假设，去做能够支持200万销售额的的过程方案，例如在推广渠道预算上、仓储物流上、人力配置上等方面做计划；还可以针对几款产品提出销售额增长的假设；

2.从人群角度做拆分

要达成1000万的销售额，一方面挖掘老客户的购买力，另一方面增加新客户的来源渠道，假设老用户复购销售500万，那么针对老用户设计营销活动。

假设分析法是在现实应用中常用的数据分析思路之一，数据分析的过程是不断的提出假设、验证假设的过程，通常我们遇到的不知道如何下手的数据分析，可以通过假设法来破局。

假设法一般用在进入新领域的时候，没有历史数据参考，没有外部线索，这个时候就需要假设。通过假设的数据进行反推，再去制定计划，整个过程是先假设，后验证，再分析结果。

比如在对新产品进行定价的时候，就是根据成本去假设一个售价，由销售情况去验证，再决定是否需要上调或者下调价格，以达到最大利润。

七、同期群分析

简单来说，就是将⽤户进⾏同期群划分后，对⽐不同同期群组⽤户的相同指标就叫同期群分析。

同期群分析有什么用？

例如：9月份新增用户10万人，10月份新增用户15万人，但9月份新增用户的30日留存用户为1万人，10月份新增用户的30日留存用户也为1万人，哪个月的运营业绩更好呢？

通过同期群分析，我们可以发现9月份和10月份新增用户的留存用户是相同的，那么9月份的留存率更高，从用户质量角度考虑，9月份的运营成果更好，从有效用户角度考虑，2个月的运营成果相同，从新增用户角度考虑，10月份的运营成果更好。

同期群分析的目的在于透过现象找到结果，以时间维度建立同期群，除按时间维度考虑，也可以对来源渠道等维度建立同期群。

八、漏斗法分析

漏斗思维本质上是一种流程思路，在确定好关键节点之后，计算节点之间的转化率。这个思路同样适用于很多地方，像电商的用户购买路径分析、app的注册转化率等等。

著名的海盗模型AARRR模型就是以漏斗模型作为基础的，从获客、激活、留存、变现、自传播五个关键节点，分析不同节点之间的转化率，找到能够提升的环节，采取措施。

九、多维法分析

多维法主要是通过对数据的切割，分成多个维度，通过立方体的形式进行数据展示。在对数据进行交叉分析的时候，可能会出现辛普森悖论，与之而来的应对方法有钻取、上卷、切片、切块、旋转等。

多维法的使用场景也很广，比如一个app的用户分析，可以从注册数、用户偏好、用户兴趣和用户流失等角度进行分析。

十、分层分析法

分层分析法，即可以弥补矩阵分析法的缺陷，又是用户分群，商品ABC分析的基础。

1.为什么要做分层，是为了应对平均值失效的场景；

张家老财主一千万，隔壁九个穷光蛋

统计局里算一算，个个都是张百万

这就是典型的平均值失效。统计的时候，因为一个张老财，把人均数值搞得不可信了。而分层分析法处理这个问题的思路也很简单：

把张老财单独分一层“老财主”

把其他人单独分一层“穷光蛋”

“老财主”≥≥“穷光蛋”

这样下次统计的时候，就可以看：有多少“老财主”，有多少“穷光蛋”，两个收入阶层单独统计平均收入，作为打土豪的依据。这样就解决了平均值失效的问题。

2.分层如何做

第一步：明确分层对象和分层指标。

比如：

想区分用户消费力，分层对象就是：用户，分层指标就是：消费金额
想区分商品销售额，分层对象就是：商品，分层指标就是：销售金额
想区分门店营业额，分层对象就是：门店，分层指标就是：营业收入

第二步：查看数据，确认是否需要分层。

分层是应对平均值失效的情况的，所以如果如下图1，存在极值影响的情况，则适合分层。如果是如2，极值影响不大，则不适合。

原则上，最大值和最小值之间差异越大（10倍以上），越值得做分层

第三步：设定分层的层级。

这是最纠结的一步，很多时候会因为到底多高算“高”而吵起来。最好的解决办法是老板拍板，所有人都不用争不用吵了。

除此以外，还有一些简单有效的判断方法，比如著名的“二八原则”。以上述销售业绩分层为例，可以先从高到低排序，然后把累积业绩占80%的人选出来，作为“第1层级（优等）”，其他的归为“第2层级（次等）”（如下图）

但是从上图也能看出，这样分并不很合理，有一些业绩很低的业务员被归入了一级。这是因为，在这一个销售团队内，业绩差异实在太大了，因此简单的二八开并不能有效区分。

此时还可以用“二四六八十”法则，即计算个体与平均值的差异，然后：

比平均值高的，根据平均值的2倍、4倍、6倍、8倍、10倍，分层
比平均值低的，根据平均值的1/2、1/4分层

这样的分层，能有效区分远远高于平均值的个体，效果如下图

分完以后，分层就结束啦！多简单

3.如何利用分层分析

分层的最大作用是帮我们看清楚：到底谁是主力，谁是吊车尾。从而指导业务，从人海战术向精兵简政思考。还拿上述的销售团队举例，如果发现A1号销售这么厉害，我们就不会想着：“人均业绩100，那想多做1000业绩，就得招10个人”，而是会去想：“怎么样再挖掘一个A1过来。”

此时，有几个常见的思考方向：

人员画像：A1是什么学历、多大年纪、多久从业经验。此时对应的做法是：找和A1有类似画像的人，应该他也能像A1一样好
人员行为：A1做了哪些事情？能取得这么好的业绩。此时对应的做法是：找到A1的关键行为，然后让其他人学A1
目标客户：A1服务了哪些客户？是不是这些客户本身更容易做？此时对应的做法是：让其他人多发展同行业的客户，然后再找新的销售，服务不容易做的客户
成长经历：A1是怎么从普通人里脱颖而出的，稳定不稳定？此时对应的做法是：如果A1是稳定成长的，则看这么培养其他人；如果A纯粹运气好，则采用大浪淘沙的战术，多搞新人进来，期望冒出头一个新A1

可见：分层分析是其他分析的前哨站，做好了分层，能引发更多思考和进一步分析。有很多讲数据分析的文章会提到分层分析，比如应用于商品的，叫ABC分类，应用于用户的，叫用户分层，应用于业务的，叫二八法则。本质都是一回事。

4.分层分析的不足之处

每种方法都不是万能的，分层分析的缺点，在于：只考虑一个分层指标。虽然简单，但是片面，不能全面说明问题。如果想采用二个指标，可以用矩阵分析法，如果想采用多个指标，可以用DEA模型。

总结

以上是几种比较常见的数据分析法，只是一些基本的入门概念，希望有一点点帮助。

至于在实际工作中如何运用，是一件很复杂很困难的事，需要将这些方法适配到自己所在的业务，甚至需要根据实际业务进行一些修改，这都需要很多的实践和思考。

我国的互联网时代刚刚完成野蛮生长的阶段，大家对流量的获取已经有所理解和应用，但在互联时代的后半场，对数据的理解和应用将成为制胜的关键。

我始终认为互联网行业的未来在运营，运营的未来则在精细化运营和有效的数据分析管理，持续学习，让我们工作用数据说话。