自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Improving the Item Selection Process with Reinforcement Learningin Computerized Adaptive Testing 笔记

项目选择是CAT有效评估考生的知识状态的关键步骤。现行的项目选择算法主要依赖于信息指标,存在两个问题:一个是内隐的认知信息,如测试项目之间的关系以及知识的成分,不能被基于信息的方法捕获,另一个是基于信息的算法根据考生的知识状态计算项目的适合度,而考生的知识状态本身就是估计的,是不精确的。为了解决这两个问题,本文提出采用强化学习技术以数据驱动的方式去自动地学习项目选择算法。它还能够正确的捕捉不同测试项目之间的内隐认知关系,避免不必要的项目测试,并且完全不依赖于考生估计的知识状态。

2023-10-27 11:10:59 41 1

原创 Balancing Test Accuracy and Securityin Computerized Adaptive Testing C-BOBCAT 阅读笔记

CAT是个性化测试的一种形式,它精确地测量学生的知识水平,同时减少测试长度。BOBCAT是最近提出的一个框架,它学习了一个数据驱动的问题选择算法来有效的减少测试长度,并且提高了测试的准确性。然而,它存在高问题暴露和测试覆盖率高的问题,这会潜在的影响测试的安全性。本文介绍了BOBCAT的约束版本,通过改变它的优化设置来解决这些问题,使我们能够权衡测试准确性的问题暴露和测试覆盖率。通过在两个现实世界成人测试数据集上的广泛测试,我们证明了C-BOBCAT是有效的。

2023-10-24 21:41:11 39

原创 A Global Information Approach to Computerized Adaptive Testing 阅读笔记

大多数CAT中的项目选择是基于费雪(Fisher)信息量(或者项目信息)的。在每个阶段,一个项目被选择来最大化当前估计的特质水平上的Fisher信息量。然而,如果估计值不接近真实值,这种Fisher信息量的应用可能比假设的效率低得多,尤其是在一个自适应测验的早期阶段,当测试长度(项目数量)太短而不能提供对真实值的准确预测时。本文认为,至少在测试的早期阶段,当估计不太可能接近真实情况时,应该使用基于全局信息的选择程序。为此,提出了一个基于平均全局信息的选择程序。

2023-10-22 12:12:54 45 1

原创 《Deep Knowledge Tracing》DKT阅读笔记

学生在回答了第1道题后,模型对学生答对第2道题的概率进行了预测,第1个小块表示对下一题答对线形图直观的概率,第2个小块表示对下一题答对直线的斜率的概率,……对RNNs的进一步的调查可以将其他特征作为输入(如花费的时间),探索其他教育影响(如提示生成,辍学预测),并验证教育文献中提出的假设(如间隔重复,学生遗忘)。但是我们发现,从44题开始,在答错几道绘制线性方程的题目后,前4个知识点(线形图直观、直线的斜率、求y轴截距、求x截距)的概率也下降了,这就意味了,绘制线性方程与这4个知识点是有联系的。

2023-09-01 21:13:11 292

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除