回归方程建立及回归参数的区间估计,但是它们都是建立在假定因变量和自变量线性相关的基础上。因此,对相关程度进行检验也是重要的,相关程度的检验方法主要有三种:
相关系数的检验
回归方程的检验
回归系数的检验
相关系数的检验
变差关系
先来一张图:
如上图所示:当给定X0时,Y的实际值与均值的差值就是Y值随X值的全部变化,称之为总变差。在总变差中,一部分变差可以用设定的回归方程解释,称之为回归变差;另一部分变差是回归方程不能解释的,称为剩余变差,它们之间有下面等式:
如果在总变差Y中,回归变差所占的比例越大,则说明Y值随X值的变化越显著,或者说X解释Y的能力越强。反之,回归变差在总变差中所占比例越小,则说明Y值随X值的变化越不显著,或者说X解释Y的能力越差。
对于所有数据点,变差之间的关系可以用离差平方和表示:
它们从左到右分别称为:总离差平方和、剩余平方和和回归平方和。
决定系数与相关系数
回归变差所占的比例越大,则说明Y值随X值的变化越显著。利用回归平方和与总离差平方和的比值来说明X与Y的相关性,称为决定系数,即有:
决定系数的开方被称为相关系数,前面介绍过相关系数r(Ex