题干:
从 UC Irvine 机器学习网站( https :// archive . ics . uci . edu / ml / datasets / student + performance,数据集由 Paulo Cortez 提供)下载葡萄牙语学生数学成绩数据集。这里有两个数据集---你需要找到与数学成绩有关的数据集。每行包含一些数值属性(第3、7、8、13、14、15、24、25、26、27、28、29、30列)和一些其他属性。我们只考虑数值属性。第33列包含数值形式的年终成绩。使用最终成绩将数据分成四个部分,每个部分由一个四分位数确定(所以表示最低的四分之一成绩的数据属于第一个部分,依此类推)。现在,使用数值特征和 k 均值算法对数据进行聚类。
数据集部分内容:
具体含义和中文解释见:大数据线性回归预测学生成绩_小曹同学i的博客-CSDN博客_学生成绩预测
计算四分位数
参考:python计算四分位及绘制箱型图_Steven灬的博客-CSDN博客_python 计算四分位数
结果:上四分位:8, 中位数:11, 下四分位:14