描述性统计分析

数据分析包括描述性统计分析和推断性统计。描述性分析主要是把观测数据本身的信息加以总结概括、整理简化,是进行后续的统计分析的基础和前提。通过描述性分析可以对数据的总体特征有比较准确的把握,从而进行更深入的统计分析。

    描述性分析分为集中趋势分析、离散趋势分析以及分布特征分析。

l  集中趋势分析:反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总和(sum)以及分位数。均数适用于正态分布和对称分布的数据,中位数适用于所有类型。

l  离散趋势分析:反映一组数据背离分布中心值的特征。主要的统计量有标准差(Std.Deviation)、方差(Variance)、极差(range)、最大值(maximum)、最小值(minimum),标准差和方差适用于正态分布。

l  分布特征分析:主要统计量有偏度系数和峰度系数。

|--偏度系数(Skewness):描述数据某变量取值分布的对称性。0为正态分布;大于0为正偏或右偏,长尾在右边;小于0为负偏或左偏,长尾在左边;

|--峰度系数(Kurtosis):描述其变量所有取值分布形态的陡峭程度。0为正态分布,大于0为陡峭,小于0为平坦。