- 相关性:如果一个变量的变化引起了另一个变量的变化
目录
一、四种基本变量
-
定类变量
-
定序变量
-
定距变量(无‘零点’概念——温度为0,仍有温度)
-
定比变量(有‘零点’概念)
二、 相关性分析方法
1.Pearson相关系数
——适用于定距变量、定比变量(变量情况不同则不能使用皮尔逊系数法)
Pearson相关系数计算的使用条件
- 两变量是定距变量或定比变量(均应由测量得到的连续变量)
- 两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布
- 变量必须是成对的数据
- 两变量间为线性关系
2.Spearman 等级相关系数
——度量定序变量与定序变量之间的相关
3.Kendall tua-b 等级相关系数
——度量定序变量间的线性相关关系(和Spearman一样)
度量原理:把所有样本点配对,看每一对中的x和y是否都增加来判断总体模式
4.卡方检测
—— 统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小。
如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。(卡方系数表作比较)
5.Eta系数
——表示的往往为非线性,Eta越高,说明相关性越强(最擅长定序/定类和定距/定比)(最不适用于定距和定距)
双变量关系强度测量的主要指标
- 此表中“定比”包含于“定距”中
- 只要有一个变量是定距,都可以用Pearson相关系数
- 在定类和定距变量关系测量中,若Pearson系数<Eta系数,则更可能呈现非线性关系(再做拟合)
*SPSS操作
- 相关性分析步骤
导入数据
- SPSS 对于“频数”的数据处理
数据->个案加权
- Eta-SPSS操作
行表示因变量、列表示自变量
三、偏相关
在多变量的情况下,变量之间的相关关系是很复杂的,多个变量要通过控制得出数据