1.3认知篇——数据分析的常见方法和思路

在数据分析中,分析方法和思路非常重要。不同的分析方法和思路可以帮助我们从不同角度了解数据,找到其中蕴藏的规律和价值。本文将按照数据分析的三类作用来介绍对应常见分析方法和思路

一、现状分析

现状分析主要是针对业务当前的情况进行分析,告诉我们过去发生了什么?以发现当前可能存在的问题或机会,从而为决策提供支持。

1、对比分析法

无对比不分析,对比思路可以说是数据分析的核心思想。
对比分析法是将不同时间点或不同对象之间的数据进行比较,从而判断它们之间的变化程度和差异性。
它的本质就是控制变量法,一般有两类对比思路:
横向对比——同时间节点跟其他同维度事物对比
纵向对比——将不同时间节点的自己进行对比,比如常见的同比、环比等
这边着重强调下注意事项:要核对指标的口径范围、计算方法、计量单位要一致

例如,我们可以通过对比来分析公司去年和今年的收入增长情况,以及不同部门之间的业务增长情况等。对比分析法通常使用柱状图、折线图等图表进行呈现,如下图可以看出销售部业务增长量是最大的。
在这里插入图片描述

2、交叉分析法

交叉分析法是将两个或以上的指标进行比较,从而探讨它们之间的关系。
例如,在分析销售业绩时,我们可以将产品销量和地区销售额进行交叉分析,以便更好地了解哪种产品在哪个地区的销售额更高,如下图的二维交叉分析表,苹果在华南销售额最高,OPPO在华东销售额最高,小米在华东销售额最高。
在这里插入图片描述

3、平均分析法

平均分析法是通过计算样本的平均数来分析数据特征的方法。一般用于对比同类现象在不同地区、不同行业、不同类型单位之间的差异程度,比总量指标更具说服力。
平均指标有:算术平均数、调和平均数、几何平均数、中位数、众数
例如,我们可以通过计算销售员的平均销售额来了解销售员的业绩情况。

4、综合评价分析法

综合评价分析法是将多种指标综合考虑后进行评价的方法。

4.1、步骤:

1.确定综合评价指标体系;
2.收集数据,并对不同计量单位指标数据进行标准化处理;
3.确定指标体系中各指标的权重,以保证评价的科学性;
4.对经处理后的指标再进行汇总计算出综合评价指数;
5.根据评价指数或分值对参评单位进行排序

4.2、三大特点:

1.评价过程不是逐个指标顺次完成的,而是通过一些特殊方法
将多个指标的评价同时完成
2.在综合评价过程中,一般要根据指标的重要性进行加权处理
3.评价结果不再具有具体含义的统计指标,而以指数或分值表
示参评单位综合状况的排序

4.3、权重确定方法

有专家访谈、德尔菲法、层次分析法、主成分分析法、因子分析法。
推荐方法:
目标优化矩阵表(原理是将人脑模糊思维转化成计算机的 1/0逻辑思维)
用法:
将纵轴上项目依次与横轴上项目对比,由专家进行投票
表决,若纵轴上项目比横轴上的项目重要,那么两个项目相交的格
子中填“1” ,否则填“0” 。最后将每行数字相加,根据合计的数
值进行排序。

二、原因分析

1、结构分析法

将一个大的系统划分成若干个小的部分进行分析,找出问题所在模块,准确定位问题。
比如,在分析公司的利润时,我们可以将公司利润分解为销售额、成本、税费等多个因素进行分析,从而找到影响利润的关键因素。结构分析法通常使用饼状图、堆叠图等图表进行呈现。
在这里插入图片描述
这个饼图展示了某公司销售收入、成本和利润的结构分析结果。我们可以清晰地看到,销售收入占比最多,成本次之,利润最少,有助于我们识别出业务中哪些环节可能存在问题,从而针对性地进行改进。

2、逻辑树分析法

逻辑树分析法是通过建立逻辑关系的树形图进行原因分析的方法。
比如,在分析产品质量问题时,我们可以通过建立逻辑树图来找到质量问题的具体原因和来源。逻辑树分析法通常使用树形图进行呈现。

产品是否具有市场竞争力?
├── 市场占有率 > 50%
│ ├── 品牌知名度 > 80%
│ │ ├── 未来持续投入研发
│ │ └── 拓展海外市场
│ └── 市场占有率 > 30% 且 市场份额增长率 > 20%
│ ├── 加强市场宣传
│ └── 优化产品品质

3、相关分析法

相关分析法是通过分析两个或以上变量之间的相关性来寻找原因的方法。
常用系数:
1、皮尔逊相关系数:又称为Pearson相关系数,是一种最常用的相关分析方法。它通过计算两个变量之间的协方差和标准差来描述它们之间的相关程度。相关系数的取值范围在-1到+1之间,其中0表示两个变量之间没有相关性,-1表示完全的反向相关,+1表示完全的正向相关。一般认为绝对值大于0.6,则相关性很强。
2、斯皮尔曼等级相关系数:在数据不满足正态分布或存在离群值时,斯皮尔曼等级相关系数是一种更加适用的相关分析方法。它使用等级而不是原始数据进行计算,因此可以避免数据中的极端值对结果的影响。与皮尔逊相关系数一样,斯皮尔曼等级相关系数的取值范围也在-1到+1之间。
3、判定系数:判定系数通常用于评估线性回归模型的拟合优度。它是由皮尔逊相关系数的平方值得出的,表示自变量对因变量的变异量能够被模型解释的比例。判定系数的取值范围在0到1之间,越接近1表示模型的拟合效果越好。
注意:
如果A和B相关,至少有如下五种可能,所以大家不要直接认定A导致B。
A导致B
B导致A
C导致A和B
A和B互为因果
小样本引起的巧合
使用场景:
例如,在分析销售业绩时,我们可以通过分析不同时间点的销售量和各种外部因素(如天气、促销活动等)之间的相关性,从而找到影响销售业绩的关键因素。

4、漏斗分析法

漏斗分析法是通过将一个流程分解为多个步骤,进而分析每个步骤的转化率和影响因素的方法。
例如,在分析营销转化率时,可以通过漏斗分析法找到目标客户的来源、转化率等关键因素。漏斗分析法通常使用漏斗图进行呈现。
在这里插入图片描述
这个漏斗图展示了一个网站访问用户、产品浏览用户、购物车添加用户和购买用户的数量。我们可以通过观察漏斗图中不同阶段的转化率,找出网站流程中存在的问题并进行优化。例如,如果在进入网站的用户数量较多,但是到最后只有一小部分用户能够成功购买,那么我们就可能需要优化网站的设计、产品推荐策略等方面,以提高购买转化率。

5、杜邦分析法

杜邦分析法是将企业业绩分解为多个组成部分,并对每个组成部分进行分析和评估的方法。例如,在分析公司盈利能力时,我们可以将盈利能力分解为净资产收益率、总资产周转率、财务杠杆等多个指标进行分析,以便更好地了解盈利能力的来源。

在这里插入图片描述

6、假设检验分析思路

假设检验分析思路是通过比较实际数据和预期数据之间的差异来判断假设的正确性的方法。

6.1、步骤

1、提出假设:首先需要提出关于总体参数的假设,包括零假设和备择假设。零假设通常表示某一总体参数等于一个特定值,备择假设则表示总体参数不等于该值或具有其他特定形式。
2、选择检验统计量:选择适当的检验统计量,并根据样本数据计算出它的值。检验统计量可以是样本均值、标准差、比例差异等,具体根据问题设定而定。
3、确定显著性水平:确定显著性水平(或称置信度)α,它代表在零假设成立时,拒绝零假设的可能性大小。一般常用的显著性水平有0.05和0.01两种。
4、计算P值并作出判断:基于假设和样本数据计算P值,即在零假设成立时,出现当前检验统计量或更极端情况的概率。如果P值小于显著性水平,则拒绝零假设,否则接受零假设。
5、得出结论:根据P值和显著性水平得出结论,并对结果进行解释和推断。如果拒绝了零假设,则说明样本数据提供了充分的证据,支持备择假设;反之,如果接受零假设,则说明样本数据不足以拒绝零假设,需要更多的样本数据或者其他信息来进一步判断。

例如,测试某款手机在两个不同时间段的用户满意度是否有明显不同。

三、预测分析法

预测分析相关的方法都相对比较复杂一些,也有一些对应的算法和模型,在这边简单跟大家分享三个,感兴趣的伙伴可以关注后续的文章。

1、移动平均

移动平均的基本思想是在一定时间范围内对原始数据进行平均值的计算来减少随机噪声的影响。移动平均适用于没有季节性波动的时间序列,但不适用于具有明显周期性或季节性的数据。
移动平均有三种类型:
简单移动平均(SMA):简单移动平均是对固定时间段内的数据进行简单平均的方法,每个数据点与其邻近数据点相等地贡献到其平均值的计算中。SMA 平滑曲线会保留数据的长期趋势,但可能会失去数据中的细节信息。
加权移动平均(WMA):加权移动平均是对固定时间段内的数据进行加权平均的方法,每个数据点加权贡献到其平均值的计算中。WMA 平滑曲线比简单移动平均更加平滑,但相对于简单移动平均消耗更多计算资源。
指数移动平均(EMA):指数移动平均是将加权移动平均推广到无限时间序列的方法。该方法会赋予最近的数据点更高的权重,即指数函数衰减因子。EMA 平滑曲线在反映最新数据方面更为敏感,且响应时间更快。

2、线性回归

线性回归是通过建立线性方程模型,以自变量和因变量之间的线性关系来描述变量之间的关系的方法。
例如,在分析销售趋势时,我们可以通过建立销售额和时间之间的线性回归模型,来预测未来的销售趋势。

3、逻辑回归

逻辑回归是将自变量和因变量之间的关系转化为概率的方法,以预测二元变量的取值。
例如,某银行分析客户是否会违约。

结语

以上是数据分析的常见分析方法和思路,这些方法不仅适用于多种数据类型和行业领域,而且可以在实际工作中帮助我们更好地了解数据,制定更为准确的决策。但需要注意的是,不同的分析方法和思路在具体的应用过程中,还需要结合实际情况进行综合分析和判断。
希望以上分享能够给你带来一些启发和帮助,如果你觉得有所收获,请给我一个正反馈,如果有所补充和建议,也请留言交流,共同学习~

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值