数据的回归与分类分析

身高遗传问题

父子身高遗传

在高尔顿身高遗传数据表中,包含了不同家庭父母及各子女的身高数据集,我们要探讨父子身高遗传的回归方程,首先需要将儿子和女儿的身高数据分开,所以需要进行以下几个步骤
在这里插入图片描述
在这里插入图片描述

首先找到数据->排序这一模块,在主要关键字一栏中选择D列(子女性别),然后按序排列,即可将儿女的数据集分开,得到如下结果
在这里插入图片描述
在这里插入图片描述
然后我们使用数据分析中的回归模块,将所有选项正确选择,即可得出父子的遗传身高回归方程
在这里插入图片描述
可以看到在此回归方程中,multiple值约为0.39,可以说相关性并不大

根据图上可知父子身高的回归方程约为Y=0.445X+38.3,所以当一个父亲身高75英寸,可以粗略地推算出他的孩子身高为71.675英寸

母子身高遗传

在这里插入图片描述
母子身高遗传的回归分析也如父子的步骤,最终得出以上结论,相关性较之于父亲可以说更小

Anscombe四重奏

以下有四组数据,它们的分布和发展趋势都不同,但经过回归分析以后,却发现这四组数据的回归方程与R值、P值都是一样的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

通过右侧的散点图,我们不难发现虽然四组数据的回归方程相当,但推算出来的方程却与实际数值相差较大,可以说除了第一张图和第三张图稍微算得上沾边,另外两组数据的回归方程简直是天差地别

Anaconda环境下的SVM线性分类

完成本任务首先需要安装Anaconda并配置相应环境,安装步骤可参考以下博文
https://blog.csdn.net/weixin_50888378/article/details/109022585

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值