身高遗传问题
父子身高遗传
在高尔顿身高遗传数据表中,包含了不同家庭父母及各子女的身高数据集,我们要探讨父子身高遗传的回归方程,首先需要将儿子和女儿的身高数据分开,所以需要进行以下几个步骤
首先找到数据->排序这一模块,在主要关键字一栏中选择D列(子女性别),然后按序排列,即可将儿女的数据集分开,得到如下结果
然后我们使用数据分析中的回归模块,将所有选项正确选择,即可得出父子的遗传身高回归方程
可以看到在此回归方程中,multiple值约为0.39,可以说相关性并不大
根据图上可知父子身高的回归方程约为Y=0.445X+38.3,所以当一个父亲身高75英寸,可以粗略地推算出他的孩子身高为71.675英寸
母子身高遗传
母子身高遗传的回归分析也如父子的步骤,最终得出以上结论,相关性较之于父亲可以说更小
Anscombe四重奏
以下有四组数据,它们的分布和发展趋势都不同,但经过回归分析以后,却发现这四组数据的回归方程与R值、P值都是一样的
通过右侧的散点图,我们不难发现虽然四组数据的回归方程相当,但推算出来的方程却与实际数值相差较大,可以说除了第一张图和第三张图稍微算得上沾边,另外两组数据的回归方程简直是天差地别
Anaconda环境下的SVM线性分类
完成本任务首先需要安装Anaconda并配置相应环境,安装步骤可参考以下博文
https://blog.csdn.net/weixin_50888378/article/details/109022585