认知诊断-DeepCDF模型学习总结

本文链接：https://blog.csdn.net/weixin_45127866/article/details/127108336

该论文提出了一种深度认知诊断模型，关注技能对问题的重要性及其相互作用，用于预测学生的学习表现。模型考虑了技能难度、关键词嵌入，并通过注意力机制和神经网络量化技能交互，进而预测学生对问题的掌握程度。实验结果表明，模型在与传统模型的对比中表现出优势，为教育领域的个性化学习提供了新的思路。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Deep cognitive diagnosis model for predicting students’ performance

发表在Future Generation Computer Systems SCI 2区 2022年

动机：现有的工作设计模式大多是从学生的角度出发，忽略了问题与技能的内在联系。这篇论文考虑技能的重要性和相互作用，即对一个问题来讲，不同技能对这个问题有不同的重要性，且技能间存在相互作用。

贡献：1.考虑了技能对问题的重要性，这是基于注意力机制获得的，其中技能和问题向量由它们的难度和关键字来表示。
2.通过神经网络获得技能交互，量化技能之间的内在关系对问题熟练度的影响。

在这里插入图片描述

模型：
1.输入层：
Q矩阵、维基百科下载的技能关键词文档、学生真实得分。
2.向量嵌入层：
对于每个题 bj ，难度是根据学生对问题的错误答案的概率来计算的。对于技能 ck，难度是根据学生对需要技能 ck 的问题的错误答案的概率来计算的。设计了一种类似于类似于多热编码的方式平衡向量的难度和关键词嵌入。具体来说，难度部分：根据关键字的个数kn来确定向量中有多少元素用来表示难度。关键词部分：从维基百科下载的解释文档中提取技能的关键词，然后将问题的关键词表示为所需的技能和技能的关键词。如果问题和技能的关键词在关键词字典中，则向量中对应位置的元素值为1，否则为0。
3.技能熟练度建模层：
这个模型考虑了5种作答情况，即客观题正确与不正确，主观题完全正确，不正确和部分正确。其中令客观题正确，主观题正确，主观题不正确的技能熟练程度为1，1，0。客观题不正确、主观题部分正确的技能熟练度基于IRT模型进行建模。
4.问题熟练度建模层：
使用加性注意力来获得问题 bj 与bj 所需技能之间的相似性
在这里插入图片描述

Sj 表示问题 bj 的堆叠矩阵, Ej 是问题 bj 所需技能的嵌入矩阵，
然后softmax得到问题bj所需问题的注意力权重。
在这里插入图片描述

将学生 si 对问题 bj 的注意力掌握程度（即结合技能对问题的不同重要程度这一思想）定义为
在这里插入图片描述

通过神经网络得到技能交互向量it’i，将注意力掌握程度向量与技能交互向量相加得到最后的问题掌握向量。

5．结合g和s使用DINA模型来预测答题情况。
6. 输出预测的成绩。
实验：做了基本实验（和其他模型比较结果RMSE和MAE），超参实验（关键词数量kn，区分度a，权重维度h，正则化参数λw），消融实验。

总结：
我觉得这篇论文的出发点与KSCD、PAKP、CDGK、RCD这些论文的出发点是有部分相似的。但是实验里做的对比试验中却没有跟这些模型做对比，只是在和DINA和IRT还有MF这些老的模型对了对比实验。和其他模型的神经网络的嵌入层不一样的是这个模型的是用了一种类似多热编码的方式平衡向量的难度和关键词嵌入。
对我的启发：这个模型里考虑到了不同的知识点对一个问题来讲的重要性是不同的，可以将这种思想加入到以后的工作中去。