数据分析的方法与技术
数据分析是指采用准确适宜的分析方法和工具来分析经过处理的数据,提取有价值的信息,从而形成有效的结论并通过可视化技术展现出来的过程。
数据分析的方法有:
- 基本分析方法:主要以基础的统计分析为主
- 高级分析方法:以计量经济建模理论为主
- 数据挖掘类:以数据仓库、机器学习等符合技术为主
普遍使用的数据分析工具有:Excel、SPSS、SAS、Eview、R语言、MATLAB、Stata(强大)和Weka等。
数据挖掘工具:Weka、QUEST、MineSet、Clementine、Rapidminer、DBMiner、Mahout
可视化设计工具:Many Eyes(免费)、D3、Protovis、Datawatch、Quadrigram、Tableau、Google Chart、JFreeChart
一、基本数据分析方法:对比分析、趋势分析、差异显著性检验、分组分析法、结构分析法、交叉分析法、综合评价分析、漏斗图分析法等
1.1 对比分析:分析对象一般为相互联系的两个指标数据,它主要展示与说明研究对象水平的高低、速度的快慢、规模的大小以及各关系之间是否协调。
对比分类方法:横向对比、纵向对比、标准对比以及实际与计划对比。
- 横向对比(静态对比):对比是同一时间条件下不同总体指标比较。
- 纵向对比(动态对比):指同一总体条件不同时间指标数值的比较。
- 标准对比:指实际指标与标准水平进行对比、了解当前指标与标准指标的差异。
- 实际与计划对比:反映实际与目标值的差异,主要是利用当前实