一、内在关系
直线回归与相关的性质或方向(正或负)相同,显著性测验等价,说明两者之间存在着必然联系。两者有以下内在联系:
(1)相关系数是标准化的回归系数
回归系数b是有单位的,但若对b作消去单位的标准化处理,即对b中x,y的离均差以各自的标准差 和 为单位:
有时把相关系数称为标准回归系数。
(2)相关系数r是y依x的回归系数和x依y的回归系数的几何平均数
对同一资料计算x依y的回归,则:
(3)线性回归方程也可用相关系数表示
可改写为:
(4)线性回归和 离回归的平方和也可用相关系数表示
上述方法可以帮助我们理解回归的意义和X变数对Y作用的大小。在回归分析中引入统计数r是恰当的。
二、应用要点
回归分析和相关分析方法简单、结果直观,实践中出现不少误用或者对结果的不恰当的解释与推断。
(1)回归和相关分析要有学科专业知识作指导。
(2)要严格控制研究对象想(X,Y)以外的有关因素,在X,Y变化过程中尽量使其它因素保持稳定一致。
(3)直线回归和相关关系结果不显著,并不意味着X,Y没有关系,只说明X,Y没有显著的线性关系,并不能排除两变数间的存在曲线关系的可能性。
(4)一个线束r或b并不代表X,Y的关系一定是线性的,并不排斥能更好地描述X,Y的各种曲线的存在。
(5)虽然显著线性相关和回归并不意味着X,Y的真实关系就是线性,但在农学和生物学研究中要发现X,Y的真实曲线关系是相当困难的。X,Y一定区间内,用线性关系作近似描述是允许的,精确度至少要比用描述y变数有显著提高。研究结果的适用范围应加以限制,一般以观察区间为准。
(6)一个显著相关或回归并不一定具有时间上的预测意义。一般由X预测Y,|r|必须在0.7以上,此时Y的变异将有49%以上可以为X的变异说明。
(7)为了提高回归和相关分析的准取芯,两个变数的样本容量n(观察值对数)要尽可能大一些,至少有5对以上。同时,X变数的取值范围尽可能宽些,可降低回归方程的误差,也可及时发现X,Y间可能存在曲线关系。