1 统计及其应用领域
数据分析所用方法可分为描述统计方法和推断统计方法。
描述统计:研究数据收集、处理、汇总、图标描述、概括与分析等统计方法
推断统计:研究如何利用样本数据来推断总体特征的统计方法
2 统计数据的类型
按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 分类数据是无序的如男女,企业按行业划分等; 顺序数据是有序的非数字型数据,如一等品,二等品等
按照统计数据的收集方法,可以将其分为观测数据和实验数据。区别为有无人为控制条件。
按照被描述的现象与时间的关系,可以将其分为截面数据和时间序列数据。
截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是不同的空间上获得的,用于描述现象在某一时刻的变化情况。如2005年我国各地区的国内生产总值数据就是截面数据。
时间序列数据:在不同时间上收集到的数据
区分数据的类型十分重要,对不同类型的数据,需要采用不同的方法来处理和分析。
对分类数据,通常计算出各组频数或频率,计算其众数和异众比率,进行列联表分析和