在软件的开发中,基于题库的计算机自适应考试已成为一个重要的发展方向,而计算机自适应题库的建立就显得尤为重要。计算机自适应测验(Computerized Adaptive Testing,简称CAT)是近年来发展起来的一种新的测验形式。这种测验以项目反应理论为基础,以计算机技术为手段,在题库建设、选题策略等方面形成了一套理论和方法。本文将简单介绍计算机自适应测验的原理和方法。
计算机自适应测验不同于传统的纸笔测验,它的测验试题的呈现和被试对试题的解答都是通过计算机完成的。计算机自适应测验也不同于一般的计算机化测验,计算机在测验过程中不光是呈现题目,输入答案、自动评分、得出结果,而且根据被试对试题的不同回答,它能自动选择适宜的试题让被试回答,终达到对被试能力作出恰当的估计。但是,该理论存在试题质量参数确定困难的问题,造成试题库建立的难度加大。
1 题库的分析与实现
1.1 原理
计算机自适应题库要解决的关键问题是建立适合每一个应试者能力的个性化测验。
一般将测量理论分为经典测量理论、概化理论和项目反应理论三大类,或称三种理论模型。人们将以真分数理论(True Score Theory)为理论假设的测量理论及其方法体系,统称为经典测验理论(Classical Test Theory,CTT),也称真分数理论。它对建立试卷、考分转换、等值等均有一套较为完整的方法。但随着测验实践的深入,此理论暴露了难以克服的弱点: (1)题目难度、区分度等严重依赖于应试者;(2)对应试者的某项能力或特质水平的估计值,只有当所有应试者使用的都是同一个或并行测验时才是可以比较的,而对于同一能力或特质的不同测验的测量效果则无法进行直接比较;(3)在应用方面,经典测量理论也表现出许多不足。
项目反应理论(item response theory)也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。但在实际考试中,存在有应试者猜题的因素,因此本题库中采用了特征函数的三参数模式。三参数模式的公式为:
式中,