为什么引入隐变量?
#e 例子
- 我们估计某箱西瓜的重量。这些西瓜来此两个产地,分别是新疆和山东。直接用一个高斯来建模显然不合适。
- 你是某个学院的老师,需要研究某个班同学的大学成绩。按照我大学的经验来看,大家的成绩和宿舍很有关联。比如我们宿舍年年排倒数第一。但是斜对角宿舍全是好学生,最后一整个宿舍都上岸了研究生。在各个宿舍内部,6个学生的成绩呈现一组高斯。但是作为老师的你,需要研究的是整个班级。这时候建模时会发现数据会聚类成几组服从高斯的散度(有几个宿舍,就是几组,比如4个宿舍)。我们并不知道各个学生属于哪个宿舍,所以不能直接用宿舍号建模。我们只能假设一个隐变量,然后进行处理。
[1] 添加链接描述