名词理解| Identifiability可识别性

最新推荐文章于 2025-03-31 09:28:15 发布

Coix

最新推荐文章于 2025-03-31 09:28:15 发布

阅读量1.1w

点赞数 16

分类专栏： Causality Machine Learning 统计学文章标签：名词解释统计学

本文链接：https://blog.csdn.net/WeiDelight/article/details/89201547

版权

统计学同时被 3 个专栏收录

7 篇文章

订阅专栏

Machine Learning

6 篇文章

订阅专栏

Causality

2 篇文章

订阅专栏

在统计学中，identifiability（可识别性）是模型必须满足的属性，以便能够进行精确推理。从理论上说，如果一个模型可以从无限的观察值中学习到模型潜在参数的真实的值，那么这个模型就是可识别的（identifiable）。从数学上来说，这个就等价于参数的不同值必须产生观察变量的不同概率分布。通常情况下，基于特定的技术约束，一个模型是可识别的。那么这些约束就称为可识别条件（identification condition）。

一个模型不能被识别通常称为non-identifiable 或者 unidentifiable （也就是说，存在两个或多个参数是可观测等价的）。在某种情况下，即使一个模型是不可识别的，仍然有可能学习到模型参数的一定子集下的真实值。这种情况我们就说模型是部分可识别的（partially identifiable）。

简而言之，一个模型是可识别的，那么其参数跟观察变量的概率分布的映射是一对一的。

具体的定义为：
令 $\mathcal{P}= {P_{\theta}:\theta \in \Theta}$ 表示参数空间 $\Theta$ 是有限或无限维的统计模型。如果映射 $\theta \mapsto P_{\theta}$ 是一对一的，那么我们就说 $\mathcal{P}$ 是可识别的。这可以表示为：
对于所有的 $\theta_{1}, \theta_{2}\in \Theta$ ，
$P_{\theta_{1}} = P_{\theta_{2}} \Rightarrow \theta_{1}=\theta_{2}。$
这个定义意味着， $\theta$ 的不同值应该对应不同的概率分布：如果 $\theta_{1} \neq \theta_{2}$ ，那么也会有 $P_{\theta_{1}\neq \theta_{2}}$ 。如果从概率密度函数角度定义分布，那么只有当它们在一组非零度量（non-zero measure）上有所不同时，两个概率密度函数应该被认为是不同的。例如，存在两个分布 $f_{1}(x)=\mathbf{1}_{0 \leq x \leq 1}$ 和 $f_{2}(x)=\mathbf{1}_{0 \leq x < 1}$ ，他们只是在单一的点 $x=\mathbf{1}$ 上不同，所以我们不能认为他们是不同的概率密度函数。
在映射 $\theta \mapsto P_{\theta}$ 的可逆性意义下，模型的可识别性等价于能够如果观察模型对应的样本很大，那么我们就能学习到模型真实的参数。也就是说，从无限的观察值中，我们将能够在模型中找到真实概率分布 $P_{0}$ ，并且由于上述可识别性条件要求映射 $\theta \mapsto P_{\theta}$ 是可逆的，我们也将能够找到生成给定分布 $P_{0}$ 的参数的真实值。

举一个线性回归模型（linear regression model）的例子说明这个概念：
令 $\mathcal{P}$ 表示标准的线性回归模型：
$\beta'x+e。$
其中， $^{'}$ 表示矩阵的转置，E(e,x)=0。当且仅当矩阵 $E (x^{'} x)$ 是可逆时，那么参数 $\beta$ 是可识别的。因此这也是模型的可识别条件。