数仓开发需要了解的BI数据分析方法

数仓开发经常需要与数据表打交道,那么数仓表开发完成之后就万事大吉了吗?显然不是,还需要思考一下如何分析数据以及如何呈现数据,因为这是发挥数据价值很重要的一个方面。通过数据的分析与可视化呈现可以更加直观的提供数据背后的秘密,从而辅助业务决策,实现真正的数据赋能业务。通过本文你可以了解到:

  • 帕累托分析方法与数据可视化
  • RFM分析与数据可视化
  • 波士顿矩阵与数据可视化

帕累托分析与数据可视化

基本概念

帕累托(Pareto)分析法,又称ABC分析法,即我们平时所提到的80/20法则。关于帕累托(Pareto)分析法,在不同的行业都有不同的应用。

  • 举个栗子

在企业的库存管理中,可以发现少数品种在总需用量(或是总供给额、库存总量、储备金总额)中,占了很大的比重,但在相应的量值中所占的比重很少。因此可以运用帕累托分析法,将企业所需的各种物品,按其需用量的大小、物品的重要程度、资源短缺和采购的难易程度、单价的高低、占用储备资金的多少等因素分为若干类,实施分类管理。

商品销售额分析中,某些商品的销售额占了总销售额的很大部分,某些商品的销售额仅占很小的比例,这样就可以将其分为A、B、C几大类,对销售额占比较多的分类进行投入,以获得更多的销售额。

在质量分析中,对某种原因导致产品质量不合格的产品数量进行分析,使用帕累托(Pareto)分析法,可以很直观的看出哪些原因造成了产品质量不合格以及哪些原因比较严重。这样就可以着重解决重要的问题,明确目标,更易于操作。

  • 另一种表述方式

根据事物在技术或经济方面的主要特征,进行分类,分清重点与非重点。对每一种分类进行区别对待管理,把被分析的对象分成 A、B、C 三类,三类物品没有明确的划分数值界限。

分类与重要程度 描述
A类(非常重要) 数量占比少,价值占比大
B类(比较重要) 没有A类那么重要,介于 A、C 之间
C类(一般重要) 数量占比大但价值占比很小

分类的核心思想:少数贡献了大部分价值。以商品品类和销售额为例:A 品类数量占总体 10% ,却贡献了 80% 的销售额。

在这里插入图片描述

数据分析案例

  • 效果图
    在这里插入图片描述

  • 实现步骤

假设有如下数据集格式:

品牌 销售额
NEW BALANCE(新百伦) 8750
ZIPPO(之宝) 9760
OCTMAMI(十月妈咪) 5800

需要将数据加工成下面的格式:

品牌 销售额 销售总额 累计销售额 累计销售额占比
=∑所有品牌销售额 =当前品牌销售额 +上一个品牌销售额 累计销售额/销售总额

具体的SQL实现如下:

SELECT
     brand, -- 品牌
     total_money, -- 销售额
     sum(total_money) over() AS sum_total_money,-- 销售总额
     sum(total_money) over(ORDER BY total_money DESC ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS acc_sum_total_money -- 累计销售额
FROM sales_money

上面给出了具体的SQL实现,其实BI工具已经内置了许多的处理函数和拖拽式的数据处理,不需要写SQL也可以将一份明细数据加工成上面的形式。

  • 结论分析

从上面的帕累托图中可以看出:A类的(绿色部分)占了总销售额的80%左右,B类(黄色部分)占总销售额的10%,C类(红色部分)占总销售额的10%。接下来可以进行长尾分析,制定营销策略等等。

RFM分析与数据可视化

基本概念

RFM模型是在客户关系管理(CRM)中常用到的一个模型,RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。

RFM模型较为动态地层示了一个客户的全部轮廓,这对个性化的沟通和服务提供了依据,同时,如果与该客户打交道的时间足够长,也能够较为精确地判断该客户的长期价值(甚至是终身价值),通过改善三项指标的状况,从而为更多的营销决策提供支持。

在RFM模式中,包括三个关键的因素,分别为:

  • R(Recency):表示客户最近一次购买的时间有多远,即最近的一次消费,消费时间越近的客户价值越大
  • F(Frequency):表示客户在最近一段时间内购买的次数,即消费频率,经常购买的用户也就是熟客,价值肯定比偶尔来一次的客户价值大
  • M (Monetary):表示客户在最近一段时间内购买的金额,即客户的消费能力,通常以客户单次的平均消费金额作为衡量指标,消费越多的用户价值越大。

最近一次消费、消费频率、消费金额是测算消费者价值最重要也是最容易的方法,这充分的表现了这三个指标对营销活动的指导意义。而其中,最近一次消费是最有力的预测指标。

通过上面分析可以对客户群体进行分类:

客户类型与等级 R F M 客户特征
重要价值客户(A级/111) 高(1) 高(1) 高(1) 最近消费时间近、消费频次和消费金额都很高
重要发展客户(A级/101) 高(1) 低(0) 高(1) 最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展
重要保持客户(B级/011) 低(0) 高(1) 高(1) 最近消费时间交远,消费金额和频次都很高。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值