信度和效度经典例子_信度、效度、难度、区分度之间有何不同?

衡量测验质量的四个指标,即信度、效度、难度、区分度,在考试中通常以客观题的形式出现,具体来说主要包括概念反选、例子反选题或判断题。而一直以来由于知识内容有一定的相似性和关联度,考生们常常区分不清产生混淆。因此,为了帮助考生们解决这一问题,我们就一同来梳理一下该知识点。

信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。

效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。

难度是指测验包含的试题难易程度。一般来说,难度可以用:“P(通过率)=通过人数/总人数”

的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。

区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。

在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:

首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。因此,我们认为在衡量测验本身质量时,效度是比信度更重要的指标。

其次是四个指标之间的相互影响。第一信信度与效度都是衡量测验质量的重要指标,两者之间的关系我们用一句话就可以总结:“信度低效度低,效度高信度高”。第二难度与区分度,测试题目难度过高或过低都会导致测验无法鉴别出学生的真实水平导致区分度较低。因此,只有在试卷中包含有不同层次的试题,保证整套题目的难度适中,才能真正鉴别出不同层次的学生,提高区分度。

到这里,相信同学们对信度、效度、难度、区分度已经有了一定程度的理解,接下来让我们来通过几个练习题来巩固一下:

【习题回顾】

1.高水平学生在测验中能得高分,而低水平学生只能得低分,说明该测验( )质量指标高。

A.效度 B.信度 C.区分度 D.难度

【答案】C。解析:区分度是能够鉴别学生真实水平的指标,能够使高水平学生得高分,低水平学生得低分。

2.当一个测验信度较低时,它的效度一定低。( )

【答案】√。解析:信度和效度之间的关系为,信度低效度一定低,效度高信度一定高。

中公讲师解析

关注微信公众号“中公教师招聘考试”

回复【时政】即可查看每日时政新闻+时政模拟

回复【资料】即可免费获取各省备考资料

注:本文章用于访问者个人学习、研究或欣赏,版权为“中公教师网”所有,未经本网授权不得转载或摘编。已经本网授权使用作品的,应在授权范围内使用,并注明"来源:中公教师网"。违反上述声明者,本网将追究其相关法律责任。

本文来自中公教师网未经允许 禁止转载

项目特征曲线(ICC)是项目反应理论(IRT)的核心概念之一,它描述了测试项目(题目)表现与被试能力水平之间的关系。在IRT中,通常使用数学模型来估计ICC参数,其中最常见的是双参数逻辑斯蒂模型(2PLM)三参数逻辑斯蒂模型(3PLM)。这些模型能够量化每个测试题目的难度(b)、区分度(a)以及猜测参数(c)。难度参数b表示某一能力水平的被试有50%的概率正确作答该项目的点;区分度参数a反映了项目对被试能力水平差异的敏感程度;猜测参数c则用于3PL模型中,描述即使在能力非常低的情况下,被试也有一定概率猜对答案的状况。 参考资源链接:[项目反应理论(IRT):从比奈西蒙到现代发展](https://wenku.csdn.net/doc/5q0q9h9ntr?spm=1055.2569.3001.10343) 在实际应用中,以2PLM为例,假设我们有一个标准化的数学测试,其中包含不同难度的算术题目。通过使用2PLM模型,我们可以估计每个题目的难度区分度参数。例如,假设题目的难度参数b=1.2,区分度参数a=0.8,这意味着能力水平为1.2的被试有50%的概率答对该题目。区分度参数较高(a=0.8),表明该项目对不同能力水平的被试区分能力较强。通过分析不同题目的ICC参数,测试设计者可以了解哪些题目能够有效地区分不同能力水平的被试,并据此优化测验设计,确保测试的信度效度。 为了更深入地理解IRT及其在心理测量学中的应用,推荐阅读《项目反应理论(IRT):从比奈西蒙到现代发展》。该书详细介绍了IRT的发展历程,从其心理测量学的起源讲起,到现代的数学模型计算机程序的应用。书中不仅涵盖了理论的发展数学模型的建立,还提供了实际应用案例分析,帮助读者全面理解项目反应理论在心理测验中的重要性,以及如在实际测试设计分析中应用这些理论知识。 参考资源链接:[项目反应理论(IRT):从比奈西蒙到现代发展](https://wenku.csdn.net/doc/5q0q9h9ntr?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值