1、 《LSA and PLSA笔记》 将LSA和pLSI的优点和缺点进行了总结和比较,是目前看到的非常好的资料;
2、 Zhou Li的博客,尤其是LSA和LDA的两篇note,不仅详细介绍了模型和求解过程、相关的背景知识,同时还有实验结果和代码;
3、 《PLSA中的EM算法 》,仅仅是介绍pLSI,不过文档中又贴了其他reference,包括我看的一份Liangjie Hong的一份资料(资料中涉及的[4]和[6]参考文献也很有价值)。原文没有太多精彩(本文更不精彩),关键看references;
4、 中科院自动化所的徐立恒博士生总结的LDA资料,其中找到了我邮论坛的ML_DM版块上的一篇好文(自己竟然都没有关注过这个版块,sigh~),文中不仅对LDA的论文进行了通俗易懂的描述,还对一些预备知识(例如dirichlet distribution, Conjugate Prior, EM)进行了简单介绍,特别是给出了它们在PRML一书中相应的章节,实在是好文!
5、 还有就是原论文了,呵呵。
还有就是在各大会议中关注主题模型的新想法出现了。