隐含变量模型
介绍
相对于标准的回归模型来说,隐含变量模型具有以下两个优点:1)可以描述丢失的信息;2)可以对预测进行不确定性描述。其中,隐含变量是不可观测的变量,比如人的健康。人的体重身高都是可测量的,但是人的健康是不可观测的。
假设某公司需要从应聘者筛选出参加现场面试的人选,他将从高中成绩,大学成绩,IQ分数,电话面试情况进行判断,如下图所示。为了有效描述missing data以及提供预测的不确定性,采用概率模型,如下图所示。假设以上影响因素为{x1,x2,x3,x4,x5},则概率模型为:![](https://i-blog.csdnimg.cn/blog_migrate/7337a94d43a8e08cd445165088e8f9c7.png)
![图1 概率模型](https://i-blog.csdnimg.cn/blog_migrate/bf00b7b0762861fe9122c9157e02d071.png)
![图2 应聘者信息](https://i-blog.csdnimg.cn/blog_migrate/fc8f7f78893598560c11a6f466aa0e35.png)
为了进一步简化模型,我们引入隐含变量intelligence,如下图所示。概率模型可以简化为:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/d1fb3b5c0cd8b28f6cc31299e05350c9.png)