心理科学进展 2010, Vol. 18, No. 8, 1339–1348
Advances in Psychological Science
计算机自适应测验中测验安全控制方法评述*
1 1 1,2
李铭勇 张敏强 简小珠
(1 华南师范大学应用心理研究中心, 广州 510631) (2 井冈山大学, 吉安 343009)
摘 要 计算机自适应测验在实际应用中曾经受到了测验安全问题质疑。国内外学者主要从两种研究
思路提出了测验安全控制的方法:一是控制项目的最大曝光率, 沿着这个思路发展出来的方法有 SH
法、项目合格方法、多重最大曝光率法等; 二是改进选题策略, 沿着这个思路发展的方法主要是 分
a
层法及其变式。此外, 近年来出现了测验安全控制方法之间相结合的研究思路。本文从均方误差、项
目曝光率、题库利用率等指标论述了测验安全控制方法的优缺点, 并概述了这些测验安全控制方法的
研究发展历程与发展思路, 展望了今后的研究趋势。
关键词 测验安全; SH 法; 项目合格方法; 多重最大曝光率法; a 分层法。
分类号 B841
1 CAT 中测验安全控制的研究背景 说, 项目的信息函数是:
1.1 CAT 在教育与心理测验实践中的应用 2 2
(1.7) a (1− c )
I (θ ) i i (1)
计算机自适应测验(Computerized Adaptive i 1.7ai (θ −bi ) − 1.7ai (θ −bi ) 2
[c + e ][1+ e ]
i
Test, CAT)是现代测量理论与计算机技术相结合 其中 a 、b 、 c 分别是区分度参数、难度参
的产物。与传统的纸笔测验相比, CAT 具有诸多 数、伪机遇参数。由公式 1 可知, 项目的 a 参数
优点, 例如:它能够根据被试能力水平选择相适 越大、 c 参数越小、 (θ − b ) 越小, 则越能够提供
i
应难度的试题, 进行施测; 不同的测验成绩具有 更大的信息量。IRT 中定义测量误差为测验信息
可比性; 不需要安排在固定的时间、固定的地点; 量的平方根的倒数( 漆书青, 戴海琦, 丁树良,
能够实时评分等等,