项目反应理论 EM估计

最新推荐文章于 2025-03-14 19:22:08 发布

Zoe____

最新推荐文章于 2025-03-14 19:22:08 发布

阅读量4.1k

点赞数 3

分类专栏：自适应学习文章标签： IRT EM

本文链接：https://blog.csdn.net/Zoe_Su/article/details/84761812

版权

自适应学习专栏收录该内容

3 篇文章

订阅专栏

项目反应理论参数的EM估计

写在前面：

本文主要描述了整个IRT使用EM算法参数的估计过程，其中涉及大量公式，如只是需要了解IRT相关基础知识，请转战wiki～～
预警： 大量公式来袭～～

IRT（项目反应理论）广泛应应用于心理测量学，相比CTT（传统测量理论）的主要优势在于不依赖于样本，能够为被试者提供具有一致性的测量结果。

IRT的基本假设：

单维性，即能力是单维度的。
局部独立性，即项目间局部独立。
项目反应函数假设，即被试者对项目对反应符合项目反应方程。

IRT 模型：

常见的IRT模型包括2PL模型和3PL模型，其中2PL模型表达式如下：

\left( \theta _ { i } \right) = \frac { 1 } { 1 + \exp \left[ - D a _ { j } \left( \theta _ { i } - b _ { j } \right) \right] }

其中

\theta _ { i }

表示被试者的能力，

a _ { j }

是项目的区分度，

b _ { j }

是项目的难度，D=1.7。

参数估计：

对于IRT参数估计有多种方法，如对于项目参数的估计有：边际极大似然估计（MMLE），极大边际后验法（MMAP），EM，MCMC等方法，对于能力参数的估计有极大似然（MLE），贝叶斯众数法（MAP），贝叶斯后验期望估计法（EAP）等。本文重点介绍对项目参数的EM估计。

建模：

被观测数据 $\mathbf { Y }$ 是N*J维的，N表示有N个被试者，J表示有J个题目， $\mathbf { Y } = \left( \mathbf { y } _ { 1 } , \mathbf { y } _ { 2 } , \dots , \mathbf { y } _ { N } \right)$ ， $\mathbf { y } _ { i }=\left( y _ { i 1 } , y _ { i 2 } , \ldots , y _ { i J } \right)$ ，其中 $y _ { i j }$ 表示第i个被试者回答第j道题目的答案；
不可观测变量为 $\boldsymbol { \theta } = \left( \theta _ { 1 } , \theta _ { 2 } , \ldots , \theta _ { N } \right)$ 其中 $\theta _ { i }$ 是第i个被试者的能力值，模型中假定 $\theta _ { i }$ 只能取离散的值 $\dots , K$ ，对应取 $q _ { k }$ 的概率为 $\pi _ { k } , k = 1 , \ldots , K$ ，即 $\theta _ { i }$ 为多项式分布，其概率为： $\boldsymbol {\pi} = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { K } \right)$ ；不可观测变量为 $\boldsymbol { \theta } = \left( \theta _ { 1 } , \theta _ { 2 } , \ldots , \theta _ { N } \right)$ 其中 $\theta _ { i }$ 是第i个被试者的能力值，模型中假定 $\theta _ { i }$ 只能取离散的值 $\dots , K$ ，对应取 $q _ { k }$ 的概率为 $\pi _ { k } , k = 1 , \ldots , K$ ，即 $\theta _ { i }$ 为多项式分布，其概率为： $\boldsymbol {\pi} = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { K } \right)$ ；
完全数据为 $\left[ \left( \mathbf { y } _ { 1 } , \theta _ { 1 } \right) , \left( \mathbf { y } _ { 2 } , \theta _ { 2 } \right) , \ldots , \left( \mathbf { y } _ { N } , \theta _ { N } \right) \right]$ ；完全数据为 $\left[ \left( \mathbf { y } _ { 1 } , \theta _ { 1 } \right) , \left( \mathbf { y } _ { 2 } , \theta _ { 2 } \right) , \ldots , \left( \mathbf { y } _ { N } , \theta _ { N } \right) \right]$ ；
待估计参数为项目参数 $\boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j })$ ，其中 $\boldsymbol { \delta } _ { j }$ 为第j道题的参数。待估计参数为项目参数 $\boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j })$ ，其中 $\boldsymbol { \delta } _ { j }$ 为第j道题的参数。

EM算法应用于IRT中是迭代估计 $\boldsymbol {\Delta}$ 和 $\boldsymbol {\pi}$ :
E step: 根据给定的缺失数据的分布，观察数据和参数初始值，求完全数据的对数似然函数的条件期望。
M step: 极大化E-step给出的完全数据的对数似然函数的条件期望，求参数的值。

似然函数

给定观测变量 $\mathbf { y } = \left( y _ { 1 } , y _ { 2 } , \ldots , y _ { J } \right)$ 并假定能力参数分布为： $\pi = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { J } \right)$ ，项目参数为 $\boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j })$ ，则观测变量的条件概率分布为：

\mathbf { y } | \mathbf { \Delta } , \boldsymbol { \pi } ) = \sum _ { k = 1 } ^ { K } f \left( \mathbf { y } , q _ { k } | \Delta , \pi _ { k } \right)

\sum _ { k = 1 } ^ { K } f ( \mathbf { y } | q _ { k } , \Delta ) \pi _ { k }

由IRT的局部独立性假设，由于给定能力变量下项目反应结果是相互独立的，可得：

\mathbf { y } | q _ { k } , \mathbf { \Delta } ) = \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { j } }

其中

\left( q _ { k } | \boldsymbol { \delta } _ { j } \right)

是题目j的项目特征曲线，描述了给定能力下项目j答对的概率。由上式可以推出，完全数据的似然函数为：

\begin{aligned} L ( \mathbf { Y } , \boldsymbol { \theta } | \mathbf { \Delta } , \boldsymbol { \pi } ) &amp; = \prod _ { i = 1 } ^ { N } \prod _ { j = 1 } ^ { J } P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { i j } } \left[ 1 - P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { i j } } f \left( \theta _ { i } | \boldsymbol { \pi } \right) \\ &amp; = \prod _ { j = 1 } ^ { J } \prod _ { i = 1 } ^ { N } P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { i j } } \left[ 1 - P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { i j } } f \left( \theta _ { i } | \boldsymbol { \pi } \right) \\ &amp; = \prod _ { j = 1 } ^ { J } \prod _ { k = 1 } ^ { K } P \left( \theta _ { k } | \boldsymbol { \delta } _ { j } \right) ^ { r _ { j k } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] ^ { n _ { k } - r _ { j k } } \pi _ { k } ^ { n _ { k } } \end{aligned}

其中，

\left( \theta _ { i } | \boldsymbol { \pi } \right) = \pi _ { k }

\theta _ { i } = q _ { k }

，

n _ { k }

是N个被试者中能力为

q _ { k }

的人数，

\boldsymbol { r }_{ j k}

则是

n _ { k }

人中答题正确的人数。
为方便计算，将上式化成对数似然函数为：

\log [ L ( \mathbf { R } , \mathbf { n } | \mathbf { \Delta } , \boldsymbol { \pi } ) ] = \sum _ { j = 1 } ^ { J } \sum _ { k = 1 } ^ { K } r _ { j k } \log \left[ P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + \left( n _ { k } - r _ { j k } \right) \log \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + n _ { k } \log \left[ \pi _ { k } \right]

E-Step:

E步估计隐变量 $\boldsymbol { \theta}$ ，在给定项目参数 $\boldsymbol {\Delta}^{(s)}$ 和能力分布 $\boldsymbol {\pi}^{(s)}$ (由M步迭代估计得到)的和观测变量下隐变量的条件分布为：
$\begin{aligned} f \left( q _ { k } | \mathbf { y } _ { i } , \Delta ^ { ( s ) } , \pi ^ { ( s ) } \right) & = \frac { f \left( \mathbf { y } _ { i } | q _ { k } , \mathbf { \Delta } ^ { ( s ) } \right) \pi _ { k } ^ { ( s ) } } { \sum _ { k ^ { \prime } = 1 } ^ { K } f \left( \mathbf { y } _ { i } | q _ { k ^ { \prime } } , \Delta ^ { ( s ) } \right) \pi _ { k ^ { \prime } } ^ { ( s ) } } \\ & = \frac { \pi _ { k } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } { \sum _ { k ^ { \prime } = 1 } ^ { K } \pi _ { k ^ { \prime } } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } \end{aligned}$

$\left( n _ { k } | \mathbf { Y } , \Delta ^ { ( s ) } , \boldsymbol { \pi } ^ { ( s ) } \right)= \sum _ { i = 1 } ^ { N } f \left( q _ { k } | \mathbf { y } _ { i } , \mathbf { \Delta } ^ { ( s ) } , \boldsymbol { \pi } ^ { ( s ) } \right)= \sum _ { i = 1 } ^ { N } \frac { f \left( \mathbf { y } _ { i } | q _ { k } , \mathbf { \Delta } ^ { ( s ) } \right) \pi _ { k } ^ { ( s ) } } { \sum _ { k ^ { \prime } = 1 } ^ { K } f \left( \mathbf { y } _ { i } | q _ { k ^ { \prime } } , \boldsymbol { \Delta } ^ { ( s ) } \right) \pi _ { k ^ { \prime } } ^ { ( s ) } }= \sum _ { i = 1 } ^ { N } \frac { \pi _ { k } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } { \sum _ { k ^ { \prime } = 1 } ^ { K } \pi _ { k ^ { \prime } } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } }$
$r _ { j k } ^ { ( s ) } = {y}_{ij}n _ { k } ^ { ( s ) }$

M-Step:

M步是使用E步计算的 $n _ { k } ^ { ( s ) }$ 和 $r _ { j k } ^ { ( s ) }$ 去迭代估计 $\Delta , \pi$ 。根据上述的对数似然函数可得：

\log \left[ L \left( \mathbf { R } ^ { ( s ) } , \mathbf { n } ^ { ( s ) } | \Delta , \boldsymbol { \pi } \right) \right] = \sum _ { j = 1 } ^ { J } l \left( \boldsymbol { \delta } _ { j } \right) + l ( \boldsymbol { \pi } )

其中

\left( \boldsymbol { \delta } _ { j } \right) = \sum _ { k = 1 } ^ { K } r _ { j k } ^ { ( s ) } \log \left[ P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + \left( n _ { k } ^ { ( s ) } - r _ { j k } ^ { ( s ) } \right) \log \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right]

\boldsymbol { \pi } ) = \sum _ { k = 1 } ^ { K } n _ { k } ^ { ( s ) } \log \left[ \pi _ { k } \right]

使用极大似然估计求 $\Delta , \pi$ ，由于 $\pi$ 是服从多项式分布的，所以很容易得到

\pi _ { k } ^ { ( s + 1 ) } = \frac { n _ { k } ^ { ( s ) } } { N }

为求

\Delta

，对

\left( \boldsymbol { \delta } _ { j } \right)

关于

\boldsymbol { \delta } _ { j }

求导：

\frac { \partial l \left( \boldsymbol { \delta } _ { j } \right) } { \partial \delta _ { t j } } = 0

\sum _ { k = 1 } ^ { K } \frac { r _ { j k } ^ { ( s ) } - n _ { k } ^ { ( s ) } P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } { \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } \frac { \partial P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } { \partial \delta _ { t j } } = 0

结果：

使用12000名学生的约100万条做题记录进行IRT参数估计，其中涉及题目约1000道左右，首先使用EM算法对题目参数进行估计，然后使用EAP对学生能力进行估计，结果分别如下：
在这里插入图片描述
上图中，ability为学生能力对评估结果，acc为学生实际答题的准确率，length为做题记录的长度，从图中可以看出，估计出的学生能力与实际答题的准确率正相关，且估计出的学生能力分布呈正态。相同做题准确率下，不同做题长度对评估结果也有影响。