最近因为想写几个简单的分类器,其实原来也没写过什么分类器,尤其是supervised.
最近在看Bayes classifier,是去产检时等叫号时看的,看过之后我明白了,之前有位指导我们的同事说的,说lda, plsa其实就是bayes分类器。
bayes classifier是一种generative model,按照feature集合生成文本。尤其是multinomial naive bayes,其实lda和plsa就是这个思路。
所以说,lda就是在bayes classifier的基础上对topic增加了一层prior.当然这不能说lda或者plsa简单,只是我们可以抽离出来去认识它们,并不是想象中那么眩惑。
在看的书是:信息检索导论第13章。