相关系数是可以用来描述定量变量之间的关系。相关系数的符号()是表明关系的方向(正相关或负相关),其值(绝对值)大小表示关系的强弱程度(完全不相关时为0,完全相关时为1)。
一。相关的类型
1.Pearson、Spearman和Kendall相关
- Pearson积差相关系数衡量了两个定量变量之间的线性相关程度
- Spearman等级相关系数衡量分级定序变量之间的相关程度,又称为秩相关系数。利用两变量的大小作线性相关分析,对原始变量的分布不做要求,属于非参数统计方法。其适用范围比Pearson相关系数要广得多。
- Kendall等级相关系数是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。
注:
- 定量变量 也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。
- 定性变量 这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。
- 有序分类变量(ordinal categorical variable)是统计学中,根据取值特征而分类的一种定性变量。所谓有序分类变量,是指其取值的各类别之间存在着程度上的差别,给人以“半定量”的感觉,因此也称为等级变量,如学历(文盲、小学、初中、高中、大学、研究生等)
- 定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高