常用数据分析方法

本文的主要内容来自《谁说菜鸟不会数据分析》

这篇主要介绍几种常用的数据分析方法。

1 对比分析方法

定义:所谓对比分析法,是指将两个或两个以上的数据进行比较,分析他们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。对比分析方法的特点是:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。对比分析法具体可以分为两大类,具体如下:

  • 静态比较(横比):在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家等。
  • 动态比较(纵比):在同一总体条件下对不同时期指标数值的比较。

进行对比分析时还要考虑以下几点因素:

  • 指标的口径范围、计算方法、计算单位必须一致,即要用同一种单位或标准去衡量。
  • 对比的对象要有可比性。对比对象之间相似之处越多,越具有可比性。
  • 对比的指标类型必须一致。

2 分组分析法

分组分析法是根据数据分析对象的特征,按照一定的标志,把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。(分组的目的是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性,组与组之间属性的差异性,以便进一步运用各种数据分析方法来解构内在的数据关系,因此分组法必须和对比法结合运用)。分组依据:

  • 在各单位数据变动比较均匀的情况下比较适合采用等距分组。
  • 在各单位数据变动很不均匀的情况下比较适合采用不等距分组。

3 结构分析法

结构分析法是指被分析总体内的各部分和总体之间进行对比,即总体内各部分总体的比例,属于相对指标。一般某部分的比例越大,说明其重要程度越高,对总体的影响越大。

结构相对指标(比例)的计算公式为:

结构相对指标(比例)=(总体某部分的数值/总体总量)*100%

4 平均分析法

平均分析法就是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。平均指标可用于同一现象在不同地区、不同部门或单位间的对比,还可用于同一现象在不同时间的对比。该方法的主要作用有两点:

  • 利用平均指标对比同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,比用总量指标对比更具有说服力。
  • 利用平均指标某些现象在不同历史时期的变化,更能说明其发展趋势和规律。

常用的平均指标有算术平均数、调和平均数、几何平均数、众数和中位数等。它的特点是将总体内各单位的数量差异抽象化,它只能代表总体的一般水平,掩盖了在的平均数后各单位的差异。

5 交叉分析法

交叉分析法通常用于分析两个变量之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系,所以叫交叉分析法。

6 综合评价分析法

综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。综合评价分析法主要包括以下5个步骤:

  • step1:确定综合评价指标体系。即包含哪些指标,是综合评价的基础和依据。
  • step2:收集数据,并对不同计量单位的指标数据进行标准化处理。
  • step3:确定指标体系中各指标的权重,以保证评价的科学性。
  • step4:对经处理后的指标再进行汇总计算出综合评价指数或综合评价分值。
  • step5:根据评价指数或分值对参评单位进行排序,并由此得出结论。

7 杜邦分析法

杜邦分析法又称杜邦财务分析体系。它是利用各主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。

8 漏斗图分析法

漏斗图比较适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。

9 矩阵关联分析法

矩阵分析法是指根据事物的两个重要属性作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析方法。

10 高级数据分析方法

常用高级数据分析法
研究方向数据分析方法
产品研究相关分析、对应分析、判别分析、结合分析、多维尺度分析等
品牌研究相关分析、聚类分析、判别分析、因子分析、对应分析、多维尺度分析等
价格研究相关分析、PSM价格分析等
市场细分聚类分析、判别分析、因子分析、对应分析、多维尺度分析、logistic回归、决策树等
满意度研究相关分析、回归分析、主成分分析、因子分析、结构方程等
用户研究相关分析、聚类分析、判别分析、因子分析、对应分析、logistic回归、决策树、关联规则等
预测决策回归分析、决策树、神经网络、时间序列、Logistic回归等

1) 聚类分析

机器学习:常用聚类算法_读万卷书 行万里路-CSDN博客_聚类算法常用数据集  聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的相似度较小。聚类是一种“无监督学习”任务。1.常用距离计算及相似度方法  给定样本Xi=(xi1;xi2;… ;xin)X_{i}=(x_{i1};x_{i2};\dots;x_{in})Xi​=(xi1​;xi2​;…;xin​)与Xj=(xj1;xj2;… ;xjn)X_{j}=(x_{j1};x_{j2};\dots;x_{jn})Xj​=(xj1​;xj2​;…;xjn​),聚类中的常https://blog.csdn.net/yeshang_lady/article/details/1185404322) 对应分析法Python进行对应分析_读万卷书 行万里路-CSDN博客_python 对应分析1 对应分析对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。该技术可以揭示同一变量中各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表中的行和列中的各元素的比例结构以点的形式在较低维的空间中表示出来。参考资料百度百科: 对应分析关于对应分析法对中国媒体网站评价的研究...https://blog.csdn.net/yeshang_lady/article/details/1137860613) 相关分析

Python进行相关分析_读万卷书 行万里路-CSDN博客_python相关分析1 相关分析1.1 定义相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法,主要研究客观事物相互间关系的密切程度。比如,研究经济增长和婴儿出生率之间的关系;研究身高和体重之间的关系等。按照不同的分类标准,可以将相关分析分为以下几类:按变量之间相关程度的高低,可以分为完全相关,不相关,不完全相关完全相关:一个变量的变化完全可以由另一个变量决定。不相关:两个变量之间完全独立,互不影响。不完全相关:两个变量之间的关系介于完全相关和不相关之间。按相关的方向分为正相关、负相https://blog.csdn.net/yeshang_lady/article/details/1137362924) logistic回归

机器学习算法:逻辑回归_读万卷书 行万里路-CSDN博客  逻辑回归是一种分类算法。其对每条样本进行“打分”,一旦分数值超过了指定的阈值,则分为一个类别;而没有达到这个阈值的则分为另一个类。https://blog.csdn.net/yeshang_lady/article/details/1180741845)回归分析(线性回归)

python进行回归方程显著性检验_读万卷书 行万里路-CSDN博客_python回归系数显著性检验1 回归分析1.1 定义  回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动的数学表达式,以便对因变量进行估计或预测的统计分析方法。回归分析的数学描述如下:  假设变量x1,x2,x3,…,xpx_{1},x_{2},x_{3},\dots,x_{p}x1​,x2​,x3​,…,xp​与随机变量yyy之间存在较显著的相关关系,则就有以下的回归模型:y=f(x1,x2,x3,…,xp)+ϵy=f(x_{1},x_{2},x_{3},\dots,https://blog.csdn.net/yeshang_lady/article/details/1150983126) 决策树

机器学习算法:决策树算法_读万卷书 行万里路-CSDN博客  决策树https://blog.csdn.net/yeshang_lady/article/details/117525302

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值