3类超实用的数据分析方法 ~

来源:大数据分析和人工智能

要使各种结构化的、非结构化的、海量的数据实现标准化、信息化,能够提供业务绩效评估、业务决策支持等要求,我们首先需要进行数据分析。

同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数据分析师的必备技能。这里整理出了一套针对不同数据分析对象所采用的三大类分析方法,每类里面包含各种小方法。

01

业务分析类

1.1 杜邦分析法

杜邦分析法目前主要用于财务领域,通过财务比率的关系来分析财务状况,其核心要点是将一个大的问题拆分为更小粒度的指标,以此了解问题出在了哪儿,从而对症下药。以电商行业为例,GMV(网站成交金额)是考核业绩最直观的指标,当 GMV 同比或环比出现下滑时候,需要找到影响 GMV 的因素并逐一拆解。 

GMV 下降如果是因下单用户减少所造成的,那么是访客数(流量)减少了,还是转化率下降了呢?如果是访客数减少了,那是因为自然流量减少了,还是因为营销流量不足?

如果是自然流量下降的话,可能需要在用户运营和产品运营端发力,如果是营销流量不足,那么可以通过营销活动或者站外引流的形式增加曝光量。

最后,如果是因为客单价不高,那么需要进行定价及促销的方案优化,比如识别具有 GMV 提升潜力的商品进行定价优化,评估当前促销的 ROI,针对选品、力度和促销形式进行优化。同时通过关联商品的推荐或商品套装促销的形式,激发用户购买多件商品,也可以有效提高客单价。

1.2 同比热力图分析法

同比热力图分析法是把各个业务线的同比数据放到一起进行比较,这样可以更直观的观察了解业务的状况。构建一张同比热力图大致需要三步:

  •  把核心问题进行分解;

  • 计算每个业务各项指标的同比数据;

  • 针对每一项指标,对比各业务的同比高低并设定颜色渐变的条件格式。

通过同比热力图的分析,首先,可以通过纵向对比了解业务自身的同比趋势,其次,可以通过横向对比了解自身在同类业务中的位置,此外,还可以综合分析 GMV 等核心指标变动的原因。

1.3 类BCG矩阵

BCG 矩阵: 又称市场增长率-相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。

波士顿矩阵由美国著名的管理学家、波士顿咨询公司创始人布鲁斯·亨德森于 1970 年首创。

基本原理:本法将企业所有产品从销售增长率和市场占有率角度进行再组合。在坐标图上,以纵轴表示企业销售增长率,横轴表示市场占有率, 将坐标图划分为四个象限,依次为“明星类产品(★)”、“问题类产品(?)”、金牛类产品(¥)”、“瘦狗类产品(×)”。其目的在于通过产品所处不同象限的划分,使企业采取不同决策,以保证其不断地淘汰无发展前景的产品,保持“问号”、“明星”、“金牛”产品的合理组合,实现产品及资源分配结构的良性循环。

这里想讲的并非传统的 BCG 矩阵,而是 BCG 矩阵的变阵,或者叫类 BCG 矩阵。根据不同的业务场景和业务需求,我们可以将任意两个指标作为坐标轴,从而把各类业务或者用户划分为不同的类型。

除此之外,我们还可以根据以下场景构建类 BCG 矩阵:

  • 分析商品引流能力和转化率:流量份额-转化率

  • 分析商品对毛利/GMV的贡献:毛利率-销售额

  • 基于RFM分析用户的价值:访问频率-消费金额

02

用户分析类

2.1 TGI指数

TGI 指数又称目标群体指数,可反映目标群体在特定研究范围内的强势或弱势。

TGI 指数=用户分类中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例*100

TGI 指数表征不同特征用户关注问题的差异情况,其中 TGI 指数等于 100 表示平均水平,高于 100,代表该类用户对某类问题的关注程度高于整体水平。

如上图所示,各类目标用户在 16-25 岁这个年龄段的占比都比总体小(TGI指数<100),其中分类 1 的用户年龄偏大,因为该类用户在 36 岁以上各个年龄段的 TGI 指数都明显高于 100,且同时高于其他三类用户。

所以,在分析用户画像时,需要根据场景进行用户分类,并对比各类用户与总体间的差异,这样才能保证分析结果的可信性和适用性,而 TGI 指数就是很好的对比指标。

当前在互联网领域,除了用户实名数据以外,其他用户的画像维度一般都通过建立模型进行判断,因此无法完全保证准确性,但不同于小样本调研,大数据分析是能容忍一定数据误差的,不过,这一切都要建立在对比的基础上。

2.2 LRFMC模型

RFM 模型是客户关系管理中最常用的模型,但这一模型还不够完善,比如对于 M(Money),即消费金额相等的两个用户而言,一个是注册两年的老用户,一个是刚注册的新用户。对于企业来说,这两个用户的类型和价值就完全不同,因此我们需要更全面的模型。

LRFMC 模型提供了一个更完整的视角,能更全面地了解一个用户的特征,LRFMC 各个维度的释义如下:

  • L(lifetime):代表从用户第一次消费算起, 至今的时间,代表了与用户建立关系的时间长度,也反映了用户可能的活跃总时间。

  • R(Recency):代表用户最近一次消费至今的时间长度,反映了用户当前的活跃状态。

  • F(Frequency):代表用户在一定时间内的消费频率,反映了用户的忠诚度。

  • M(Monetary):代表用户在一定时间内的消费金额,反映了用户的购买能力。

  • C(CostRatio):代表用户在一定时间内消费的折扣系数,反映了用户对促销的偏好性。

03

产品运营类

产品运营是一个长期的过程,需要定期对产品的使用数据进行监控,通过用户行为分析发现问题,从而确定运营的方向,同时也可以用于评估运营的效果。

产品运营的常用指标如下:

  • 使用广度:总用户数,月活;

  • 使用深度:每人每天平均浏览次数,平均访问时长;

  • 使用粘性:人均使用天数;

  • 综合指标:月访问时长=月活*人均使用天数*每人每天平均浏览次数*平均访问时长。

产品所处阶段不同,运营的侧重点也会有所不同。在产品初期,核心的工作是拉新,应该更加关注产品的使用广度,而产品的中后期,应该更加注重使用深度和使用粘性的提升。

对于不同的产品也需根据产品的性质来确定核心指标,比如,对于社交类产品,使用广度和使用粘性至关重要,而对于一些中台分析类产品,提升使用深度和使用粘性更有意义。

写在最后:在一款数据产品诞生前,应该是先有数据,再有分析,然后才是产品,分析的广度和深度直接决定了产品的定位和价值。

如果是做一款数据报表类的产品,那么需要了解核心指标,并建立综合指标的评估体系。如果是做一款分析决策类产品,那么还需要基于业务需求,将现有数据指标进行解构再重构。


End


    13个Pandas实用技巧,有点香 !    机器学习万字实战宝典!    数据分析里常用的五个统计学概念
『数据不吹牛』二群限额开启后台回复“入群”即可加入

“有用!”

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值