node2vec
在其中只用到了问题特征向量
摘要
知识追踪是根据学生过去的表现来预测他们未来的表现。现有模型大多以技能为输入,忽略了问题信息,进一步限制了模型的性能。受推荐系统中项目-项目协同过滤的启发,我们提出了一种知识追踪的问题-问题协同嵌入方法来引入问题信息。具体来说,我们结合了学生与问题的互动和问题与技能的关系来捕捉问题的相似性。基于相似度,我们进一步学习问题嵌入,然后将问题嵌入到神经网络中进行预测。实验表明,CoKT在三个基准数据集上的性能明显优于基线。此外,可视化结果表明,当交互数据较稀疏时,CoKT可以学习可解释问题嵌入,并实现更明显的AUC提升。
1 引言
知识追踪(Knowledge Tracing, KT)是智能教学系统中的一项重要任务,旨在追踪学生一段时间内的知识状态,预测学生正确回答新问题的概率。
研究人员提出了多种KT模型,包括基于概率的模型[1]、因子分析模型[10]和深度模型[6,13]。在本文中,我们关注的是深度模型的类型,它利用了深度学习的最新进展,并在KT中取得了巨大的成功[6,13]。一般来说,大多数深度KT模型都是输入技能和估计技能的掌握,而不是评估学生正确回答特定问题的能力。因此,它们被定义为技能级别模型[4]。这些模型只使用技能来表示问题,这使得它们无法区分技能相同但在其他方面(如难度)不同的问题[3,8]。
为了区分不同的问题,一个直接的方法是在这些模型中输入问题而不是技能。但是,由于很多问题都是少数学生尝试的,所以KT模型很难捕捉到这些问题的特点,也很难对这些问题正确回答的概率做出准确的预测。这个问题被称为稀疏性问题,也在[4,8,11,12,14]中讨论过。
为了解决稀疏性问题,我们的基本思路是引入问题相似度。这种想法的基本假设是,如果同一个学生回答了两个问题,并且给出了相同的答案(都是正确的或都是错误的),或者他们拥有相同的技能,那么他们就被认为是相似的。此外,同一个学生正确回答类似问题的概率很接近。因此,基于问题的相似度,KT模型可以对训练记录较少的问题做出更准确的预测,从而减少稀疏性问题的困扰。为此,我们提出了一种面向知识追踪的协同嵌入方法(CoKT),从可访问数据中挖掘问题相似性,并进一步学习问题嵌入。技术上,我们首先根据学生与问题的互动和问题与技能的关系分别构建了两个图。其次,我们从两个图中生成包含问题相似度的问题节点序列。最后,通过skip-gram算法将相似度转化为问题嵌入。
本文的研究成果如下:1)提出了一种提取问题相似度的方法,增强了问题的表达能力。2)据我们所知,我们是第一个使用学生-问题交互图来学习问题嵌入的。3)该方法显著提高了KT模型的预测性能,能够学习可解释问题嵌入,缓解稀疏性问题。
2 相关工作
2.1 知识追踪
由于仅以技能作为输入限制了模型的性能,一些研究提出利用问题信息作为补充。根据他们主要使用的问题信息类型,我们将这些作品分为两类。一类模型利用问题的内在信息,如文本描述和难度。例如,[3,9]将文本描述编码为问题嵌入,以捕获问题的个别特征。[5]计算问题的难度,并利用它来区分具有相同技能的问题。另一类模型主要关注学生之间、问题和技能之间的互动信息,如学生与问题的互动和问题与技能的关系。例如,[11]使用问题和技能之间的关系作为约束来训练问题嵌入。在我们的工作中,我们不仅利用问题-技能关系,而且利用学生-问题交互来挖掘问题的协同信息,然后学习基于node2vec算法的问题嵌入。
2.2 item-item协同过滤
项目-项目协同过滤[7]是推荐系统中的一种技术,它利用用户对项目的评分计算项目之间的相似度(协同),然后根据候选项目与用户已打分项目的相似度(过滤)向用户推荐候选项目。受此启发,我们从学生-问题互动和问题-技能关系(协作)中挖掘问题之间的相似性,然后将相似性信息转化为问题嵌入(embedding)。
3 问题定义
3.1 知识追踪
3.2 学生-问题交互图
3.3 问题-技能关系图
4 方法
CoKT的总体框架如图1所示,包括四个模块:预训练模块、融合模块、知识状态(KS)模块和预测模块。CoKT的亮点在于预训练模块
6 结论
在本文中,我们解决了在KT模型中只使用技能来表示问题所引起的问题。我们提出了一个新的模型CoKT,该模型从学生-问题互动和问题-技能关系中提取问题相似度,以增强问题的表征。实验表明,CoKT的性能明显优于基线,可以缓解稀疏性问题。在未来的工作中,我们打算利用更丰富的互动信息,如练习时长,更精确地描述学生与问题的互动过程。