统计分析——描述统计
描述统计是通过图表或数学方法,对资料进行整理、分析,对数据的分布状态、数字特征和随机变量之间的关系,进行估计和描述的方法。描述统计分为集中趋势分析、离散趋势分析和相关分析。
1、集中趋势分析
集中趋势是指一组数据项某一中心值靠拢的程度,它反映一组数据中心点的位置。最常见的集中趋势分析包括计算均值、众数和中位数。
-
均值:又称算术平均值,是指在一组数据中所有数据之和除以数据的个数,常用来表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。
-
中位数:是一组数据 排序后处于中间位置上的变量值。用Me表示
3.众数:是一组数据中出现次数最多的变量值,用Mo表示。众数主要用于测度分类数据的集中趋势,也适用于顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有数据量大的情况下,总数才有意义。
2、离散趋势分析
离散趋势在统计学上描述观测值的偏离中心位置的趋势,反映了所有观测值偏离中心的分布情况。常用的指标有极差、四分位间距、方差与标准差、变异系数。
- 极差:即用数据中的最大值减去数据中的最小值。是用数据变动的幅度来反映其分散状况的特征值。
- 方差:方差是每个样本值减去全体样本值的均值的平方值之和。
在实际工作中,总体均值难以得到时,应用样本统计量代替总体参数
S^2= ∑(X- ) ^2 / (n-1) - 标准差:标准差是方差的算术平方根。
- 变异系数:变异系数又称为离散系数。是数据分散成程度的一个归一化量度,其定义为标准差与平均值之比:
若两组数据度量单位与平均数相同时,可采用标准差来比较;反之,则利用变异系数比较。
5.异众比率:是指总体数据中非总数次数与全体次数之比。主要用于测度分类数据的离散程度,当然,顺序数据以及数值型数据也可以计算异众比率。
3、相关分析
相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题。相关分析与回归分析之间的区别:回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量;相关分析侧重于发现随机变量间的种种相关特性。相关分析在工农业、水文、气象、社会经济和生物学等方面都有应用