说明:本文系个人学习笔记,分享给小伙伴们共同进步。来源于微信公众号 数据管道,如有需要自行去关注。请勿将本文转载以及做其他用途。
数据特征分析包括:分布分析、对比分析、统计分析、贡献度分析(帕累托分析)、以及相关性分析。
(1)分布分析
用来解释数据的分布类型和分布特征,显示其分布情况。
- 定量数据的分布分析
求极差 -->决定组距与组数-->决定分点-->绘制频率分布图
- 定性数据的分布分析
根据变量的分类类型来确定分组,然后使用图形对信息进行显示
(2)对比分析
对比分析是指把两个相互联系的指标进行比较,从数量上展示和说明研究对象规模的大小、水平的高低、速度的快慢,以及各 种关系是否协调。特别适用于指标间的横纵向比较、时间序列的比较分析。在对比分析中,选择合适的对比标准是十分关键的 步骤,选择合适,才能做出客观的评价,选择不合适,评价可能得出错误的结论。
- 绝对数比较
利用这组指标绝对数进行对比,从而寻找差异的一种方法。
- 相对数比较
它是由两个有联系的指标对比计算的,用以反映客观现象之间数量联系程度的综合指标,其数值表现为相对数。由于研究目的 和对比基础不用,相对数可以分为以下几种:结构相对数、比例相对数、动态相对数和空间相对数
(3)统计分析
对一组数据用统计指标定量的分析数据,一般从集中趋势和离中趋势两个方面来衡量数