由于许多数据统计分析结果来自于部分甚至少量的样本,因此所得的统计结果可能存在偶然性,需要对样本统计结果进行显著性检验,以查看统计结果的可靠性程度。
显著性检验分为不同的类别和对应不同的方法。数据的相关性及其检验和数据组之间的差异及其显著性检验是比较常见的两种统计分析方法,在地学、商业、教育、医学等都常用。
1 相关性分析及其显著性检验
1.1 相关分析(Analysis of Correlation)
相关分析是研究两个或两个以上的随机变量间的相关关系的统计分析方法,例如降水与地形、降水与温度等的相关关系。相关分析前,首先通过散点图了解变量间大致的关系情况。
如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。
再举个栗子:图中Ratio明显随着Mean rainfall的变化而变化,说明概率分布在变化,因此具有一定的相关性。相关分析是回归分析的前提。
<