实验名称: 研究数据相关性对机器学习的影响
实验目的:
1 熟练coursera上NG所学机器学习课程所学习的算法 |
2 如果将PCA理解为是通过减少数据的线性相关性来达到降维目的的话,本实验想要从实验的角度来观察保持其他不变,只更改数据线性相关性是否会改变机器学习的结果。 |
实验工具:Octave
实验数据: 某普通高中2012年高考成绩单;该文档所涉及实验程序
实验步骤:
一 数据处理:
1.1 样本空间:仅保留了理科(理工、艺术理、体育理、美术理)学生的成绩,其余全部清除,最后留下246名学生的成绩(确实有点少,此实验极大地瑕疵)。
1.2 保留科目:
科目列表一:
语文 | 语客 | 语主 | 数学 | 数客 | 数主 | 英语 | 英客 | 英主 |