认知诊断-DeepCDF模型学习总结

Deep cognitive diagnosis model for predicting students’ performance

发表在Future Generation Computer Systems SCI 2区 2022年

动机:现有的工作设计模式大多是从学生的角度出发,忽略了问题与技能的内在联系。这篇论文考虑技能的重要性和相互作用,即对一个问题来讲,不同技能对这个问题有不同的重要性,且技能间存在相互作用。

贡献:1.考虑了技能对问题的重要性,这是基于注意力机制获得的,其中技能和问题向量由它们的难度和关键字来表示。
2.通过神经网络获得技能交互,量化技能之间的内在关系对问题熟练度的影响。

在这里插入图片描述

模型
1.输入层:
Q矩阵、维基百科下载的技能关键词文档、学生真实得分。
2.向量嵌入层:
对于每个题 bj ,难度是根据学生对问题的错误答案的概率来计算的。对于技能 ck,难度是根据学生对需要技能 ck 的问题的错误答案的概率来计算的。设计了一种类似于类似于多热编码的方式平衡向量的难度和关键词嵌入。具体来说,难度部分:根据关键字的个数kn来确定向量中有多少元素用来表示难度。关键词部分:从维基百科下载的解释文档中提取技能的关键词,然后将问题的关键词表示为所需的技能和技能的关键词。如果问题和技能的关键词在关键词字典中,则向量中对应位置的元素值为1,否则为0。
3.技能熟练度建模层:
这个模型考虑了5种作答情况,即客观题正确与不正确,主观题完全正确,不正确和部分正确。其中令客观题正确,主观题正确,主观题不正确的技能熟练程度为1,1,0。客观题不正确、主观题部分正确的技能熟练度基于IRT模型进行建模。
4.问题熟练度建模层:
使用加性注意力来获得问题 bj 与bj 所需技能之间的相似性
在这里插入图片描述

Sj 表示问题 bj 的堆叠矩阵, Ej 是问题 bj 所需技能的嵌入矩阵,
然后softmax得到问题bj所需问题的注意力权重。
在这里插入图片描述

将学生 si 对问题 bj 的注意力掌握程度(即结合技能对问题的不同重要程度这一思想)定义为
在这里插入图片描述

通过神经网络得到技能交互向量it’i,将注意力掌握程度向量与技能交互向量相加得到最后的问题掌握向量。

5.结合g和s使用DINA模型来预测答题情况。
6. 输出预测的成绩。
实验:做了基本实验(和其他模型比较结果RMSE和MAE),超参实验(关键词数量kn,区分度a,权重维度h,正则化参数λw),消融实验。

总结
我觉得这篇论文的出发点与KSCD、PAKP、CDGK、RCD这些论文的出发点是有部分相似的。但是实验里做的对比试验中却没有跟这些模型做对比,只是在和DINA和IRT还有MF这些老的模型对了对比实验。和其他模型的神经网络的嵌入层不一样的是这个模型的是用了一种类似多热编码的方式平衡向量的难度和关键词嵌入。
对我的启发:这个模型里考虑到了不同的知识点对一个问题来讲的重要性是不同的,可以将这种思想加入到以后的工作中去。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值