IRT模型的公式如下:
参数解释:
D | 常数,1.702 |
θ | 测试学生的能力值(即需要求解的参数) |
pi(θ) | 测试学生做对该题目的概率,i:第几题 |
bi | 题目的难度,i:第几题 |
我们最终目的是要根据学生的做题对错情况来评估这个学生的当前能力值,也就是公式中的“θ”参数。其实问题就转化为当我们看到观测数据(学生做题对错),确定该学生的能力值是多少才能得到这样的做题对错序列。这样我们可以使用极大似然估计方法来估计“θ”的值,因为极大似然估计的目标就是找出一组参数,使得模型产生出观测数据的概率最大。
极大似然估计
举例:
现在有一个正反面不是很匀称的硬币,如果正面朝上记为H,方面朝上记为T,抛3次的结果为:H,H,T,求这个硬币正面朝上的概率为多少?
显然,从“潜意识”中看出正面朝上的概率为2/3。
现在,使用极大似然估计方法求解:
设正面朝上的概率为u,如果要抛出X = HHT的结果的概率 为P(X;u) = u * u * (1-u),这个公式就是似然函数,也就是所谓的模型。
现在问题就转化为u的值为多少才能使P(X;u)的值最大,也就是最有可能出现HHT现象。对似然函数求导取极值可以得到结果为2/3,这个函数曲线如下,从图中也可以看出当正面朝上概率u为2/3时,P(X;u)最大。结果与我们的“潜意识”是一致的。
回到能力值问题,假设一个学生做的题目对错情况如下表(1:回答正确;0:回答错误)
Question user | Ques 1 | Ques 2 | Ques 3 | ... |
Student 1 | 1 | 1 | 0 |
|
Student 2 | 1 | 0 | 0 |
|
... |
|
|
|
|
对于Student1的答题情况为X=110,则似然函数P(X;p) = p1(θ) * p2(θ) * (1 -p3(θ)) ,再把IRT模型公式代入,这样就跟求解抛硬币例子一样了,大致会出现如下图,曲线最高峰对应的x轴即为所求能力值(Student2 也是这样求,etc)。
补充:
现在计算的能力值只是根据对错信息得出,但是实际上学生做题时长也是一个参考因素,所以目前也会对计算出的能力值再结合做题时长进行调整。