在mixture model中,
存在latent variable,可以factorize depending on the z, 即log-likelihood function中 log内有summation的形式或者integration形式
在topic model中有parameter 和 hyper parameter, 首先我们不要consider hyper parameter,只对parameter与observation 进行model,
即log-likelihood 是
ln p(x|theta) = sigma_ln p(x_i|theta) = sigma_ln sigma_i {p(x_i|z_i)p(z_i|theta)};
即将marginalise的z latent variable explicitly represent 出来了。
ln中有sigma,所以intractable.
要用EM 去model complete data p(x,z|theta);