论文计算机应用技术英语,毕业论文设计《计算机应用技术论文自适应性英语测试研究难点所在》.doc...

l

计算机应用技术论文:自适应性英语测试研究难点所在

摘要:自适应性测试从提出发展至今,虽然已经取得一定的成果,但是影响自适应测试普及的瓶颈依然存在。本文在简要介绍自适应测试理论的基础上,以英语水平测试为例,分析了自适应测试中的多个难点,并指出自适应测试研究发展的长期性和复杂性。

关键词:自适应性 测试项目反应理论 英语水平测试 难点

引言

随着计算机技术在各类考试中的应用,自适应测试日益成为人们关注和研究的课题。自适应测试全称为计算机化自适应测试(Computerized Adaptive Testing—CAT)[1],是以项目反应理论为核心,主要用于解决计算机化测试中如何客观公正地评价每一位受试者真实水平的一种较为科学的评估方式。

一、自适应性测试的理论基础

最早的自适应性测试可以追溯到比奈测验,在比奈测验中呈现给受试者的下一个测验项目是根据他对前一个项目的反应决定的,即对各种不同能力水平的被试(testee)给予难度合适的测试项目[2]。随着计算机技术的发展,后来出现了计算机辅助测试。这种机辅测试仍以经典测试理论为依据,多为纸笔测试形式的电子版,除了测试媒介的改变外,并无实质性进步。直到70年代末80年代初项目反应理论(Item Response Theory(IRT))与计算机技术相结合,出现了基于计算机的自适应测试,才充分发挥了计算机优势,使测试的实施更加有效,测量也更加准确。

项目反应理论的实质是一条项目特性曲线,并以多种数学表达式来描述其所包含的两个方面的参数:测验项目的特征参数和考生的特征参数,又称能力参数。在测试中,系统经过分析被试者回答问题的情况,再通过题目特征函数的运算来推测受试者的能力。与其他测试理论相比,项目反应理论的创新点在于其以四个强假设为基础:

1、能力单维性假设。即测试中某一能力变量的测量独立于其他能力变量,在分析时可置于一个分析量表中,因而不同被试者的同一能力变量之间可以相互比较。

2、局部独立性假设。即受试者对于每个测试项目的回答或反应在统计上是独立的,测试题目之间不存在相互影响。

3、试题特征曲线假设。这一假设通常用一个单调上升的函数来表示被试者对于某一道试题的正确反应的概率。目前最常见的模型为在二值评分方面常用的单参数、两参数和三参数的Logistic模型[3]。

4、速度无关性假设。通常自适应测试都含有一个隐含的假设:进行测验时,受试者不被规定在一段时间内完成测试,即完成测试的时间具充分性。被试者有足够的时间完成测试,如若答错试题,则原因就是能力不够。

二、自适应性英语水平测试的优势

自适应性测试作为一种先进的测试方法,已经应用于多种学科的考试之中,其中以英语水平的测试最为常见。较之于传统的纸笔考试,自适应性英语测试有着明显的优势:

1、试题参数如难度,鉴别度和猜测度不会因为试题样本的不同而异,能够更客观、精准地反映考生的实际水平。

2、大规模英语水平测试采用自适应模式,考试时间及地点没有硬性规定,学生可以在任意时间登录系统完成测试,从而根据自己的学习状况进行自测。

3、选择在考生能力水平附近的试题进行测试,能够节省测试时间,更加准确地测量出考生的英语水平。

三、自适应性英语水平测试研究难点

1、受试者是否能适应机考模式

因被试者计算机水平的差异及受测时的焦虑程度不同,自适应性英语水平测试中公平性往往受到质疑。譬如,被试者对计算机操作不够熟知,或受计算机屏幕尺寸的限制,每页显示文本有限,长篇阅读文章会加重考生认知记忆负担而影响考试发挥。

2、试题材料如何赋值

在自适应英语水平测试中,对语言材料进行赋值,试题参数在确定难度等级时的权重,以及不同任务类型是否会带来不同难度结果等等,这些都是难以解决的问题。以听力为例,词汇难度、语速、语音、句子结构、谈话主题、体裁等都会影响材料的难度,而题项所考察的微技能和任务类型也会影响试题的难度。对测试材料难度等级的各个因数值的确定以及不同微技能和任务类型对测试难度的影响都需要通过试验才能获得。

3、组卷公平性以及试题库更新

因自适应测试采用自动抽题模式,考生在测试中所抽题目各不相同。而考生对于试题题材的背景知识了解存在差异,测试时的发挥就可能会受到影响。试题库的更新也是需要解决的问题之一。如果系统内的试题不能及时更新,则重复使用同一系统测试的学生可能会抽到以往测试过的题目,影响测试的精准度。

结语

将以项目反应理论为基础的自适应性测试应用于英语水平测试中,是现今英语水平测试发展的主流方向。然而,建立自适应性英语测试系统仍存在如试题难度赋值等难以解决的问题,有待更进一步的研究。

参考文献:

[1]李卫东、黄河笑、郭俊文:《IRT在自适应考试中的应用》,《计算机工程》,2001年27卷第7期。

[2]付聪:《计算机自适应测试研究进展》,《现代情报

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值