在判断一个数据是否属于某个类可以用p(x)来进行判断,我们知道概率密度的情况下,很好求p(X).
当遇到一个奇怪的分布,我们不知道是什么分布,在教课上我们也找不到这个分布,我们常见的分布有高斯分布,有可能这个分布有2个高斯分布联合产生的。
上图是2个高斯分布形成的,我们不知道数据的标签,也不知道数据是属于哪个高斯分布的即分布的概率密度不知道。
由于我们不知道数据的类别,我们可以假定一个隐含变量z,z属于伯努利分布,P(x|z)属于高斯分布,如果假设知道数据来自哪个高斯分布,即知道z,我们可以用极大似然估计来估计相关参数。