当代社会,随着信息技术的突飞猛进,高等学校的教育教学改革的深入化也受到了深刻的影响。尤其处于大数据时代,数据挖掘的各种方法被应用到教育行业[1-6],为寻找更好的教育教学方法提供了新思路。学生成绩在高等学校里不但是衡量学校人才培养水平的一个重要指标,同时也是教育大数据中的一个重要内容。由于学生成绩具有数据类型相对统一,数据量较大,相对容易获取等特点,因此依据恰当的数据挖掘技术,对学生成绩进行不同角度的深入挖掘和分析,从而得到指导教学的新方法或新理论的研究成为高等学校教学改革的一个研究热点。丁智斌等[7]利用决策树中的ID3算法对学生成绩进行分析,从而得出了影响学生成绩的内部原因及一些其他相关结论。喻铁朔等[8]是基于支持向量机(support vector machine, SVM)等4种数据挖掘的方法对学生成绩进行预测,从不同角度对4种模型进行对比,得出不同模型适用于不同课程的结论,对高校学生课程成绩预测。钟文精等[9]基于k-means聚类算法,对学生成绩进行聚类分析,为进行深入的教学改革和设计提供数据依据。本文依据可拓数据挖掘中的几种重要算法及皮尔逊相关系数,对北京某高校经管类学生的数学课程相关成绩进行多角度深入分析,从而得到一些和教学相关的重要结论,为改进教学方法,提高教学质量给出合理化建议。
1. 基础知识与算法
1.1 可拓支持向量机
可拓学是由广东工业大学蔡文研究员创立的一门原创学科。在众多专家学者的不懈努力下,历经30余年的潜心研究,建立了可拓论体系和可拓创新方法体系[10-18]。可拓数据挖掘[19-20]