这里写目录标题
线性回归练习。“父亲高则儿子高,父亲矮则儿子矮”(即父亲与儿子身高相关,且为正相关)、“母高高一窝,父高高一个”(即母亲的身高比父亲的身高对子女的影响更大)的习俗传说是否成立?请在“父母子女身高”数据集(高尔顿数据集)基础上利用线性回归做出科学分析。
通过上面的公式y=0.241x+53.34,发现当父亲身高每增加1个单位,其儿子的身高增加0.241个单位。
相关系数R平方计算的结果为0.9086,父亲身高与儿子身高的线性相关性很强。通过方差分析的表格可以看出F>F表,说明数据存在显著差异。P值远小于0.01,说明得到的回归方程是可靠的。
数据分析:
通过上面的公式y=-0.0082x+71.007,发现当母亲身高每增加1个单位,其儿子的身高增加-0.0082个单位。
相关系数R平方计算的结果为0.003,母亲身高与儿子身高的线性相关性较弱。通过方差分析的表格可以看出F>F表,说明数据存在显著差异。P值远小于0.01,说明得到的回归方程是可靠的。
由此说明,父子的身高是有一定关系的。
线性回归方法的有效性判别。 针对“Anscombe四重奏”数据集,用excel对四组数据进行线性回归分析,判断其中哪些回归方程是成立的,哪些不成立?不成立的应该如何解决?
从图中可以看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于6次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
可以看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于2次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
可以看出,这条直线可以很好的拟合这个数据集,只是有少数一个一两个点有偏差,这是正常的。
可以看出,这条直线并不能拟合数据集,故线性回归方程不成立。可采用其他的函数来进行拟合。