一.相关分析的基本概念
1、变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。
2、函数关系:是一一对应的确定性关系
3、统计关系:一个变量的值不能由另一个变量的值唯一确定
4、相关分析:衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。
5、相关分析的方法:散点图、计算相关系数
6、如果相关系数是根据总体全部数据计算的,称为总体相关系数,记为p;如果是根据样本数据计算而来的,则称为样本相关系数,记为r。
7、(0,1]:表示变量间存在正相关关系,即两个变量的相随变动方向相同;
【-1,0):表示变量间存在负相关关系,即两个变量的相随变动方向相反;
|r|为1时,二者为函数关系
|r|>=0.8,视为高度相关
0.5< |r|<0.8,视为中度相关
|r|<0.3,可视为不相关
在一般情况下,总体相关系数P时未知的,往往是用样本相关系数r作为总体相关系数P的估计值。
二.二元定距变量的相关分析
1、二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关分析和二元定序变量的相关分析。
2、在二元变量的相关分析过程中比较常用的相关系数为:Pearson简单相关系数,Spearman和Kendall‘s tua-b等级相关系数。
3、定义:二元定距变量