例子来自QE回归2017年1月的第4题,目的是通过高中成绩排名X1与ACT分数X2预测大学第一年的GPA。数据在
https://statistics.arizona.edu/sites/default/files/uagc_page/jan_17_data_sets.xlsx初始模型是
然而高中成绩排名与ACT分数很有可能是正相关的,因此这个模型有潜在的多重共线性,我们先来检查一下样本数据有没有多重共线性。首先读取数据,画出相关性图,并计算相关性矩阵
college.df = read.csv( file.choose() )
attach( college.df )
X1 = class.rank; X2 = ACT; X3=X1*X2
Y = GPA
pairs( Y~X1+X2+X3, pch=19 )
> cor( cbind(X1,X2,X3) )
X1 X2 X3
X1 1.0000000 0.4425075 0.8883073
X2 0.4425075 1.0000000 0.7890032
X3 0.8883073 0.7890032 1.0000000