《机器学习应用视角》编程练习8.3

这篇博客介绍了如何从UCIrvine机器学习网站获取葡萄牙语学生数学成绩数据集,并基于数值属性进行预处理。通过计算四分位数将数据分为四部分,然后利用k均值算法对数据进行聚类分析。文中提供了数据集的部分内容,并给出了上四分位数、中位数和下四分位数的值,分别为8、11和14。
摘要由CSDN通过智能技术生成

题干:

从 UC Irvine 机器学习网站( https :// archive . ics . uci . edu / ml / datasets / student + performance,数据集由 Paulo Cortez 提供)下载葡萄牙语学生数学成绩数据集。这里有两个数据集---你需要找到与数学成绩有关的数据集。每行包含一些数值属性(第3、7、8、13、14、15、24、25、26、27、28、29、30列)和一些其他属性。我们只考虑数值属性。第33列包含数值形式的年终成绩。使用最终成绩将数据分成四个部分,每个部分由一个四分位数确定(所以表示最低的四分之一成绩的数据属于第一个部分,依此类推)。现在,使用数值特征和 k 均值算法对数据进行聚类。

数据集部分内容:

具体含义和中文解释见:大数据线性回归预测学生成绩_小曹同学i的博客-CSDN博客_学生成绩预测

计算四分位数

参考:python计算四分位及绘制箱型图_Steven灬的博客-CSDN博客_python 计算四分位数

结果:上四分位:8,   中位数:11,   下四分位:14

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值