NLP
woshizhouxiang
这个作者很懒,什么都没留下…
展开
-
推荐系统——找出内容近似的文章
http://www.52nlp.cn/category/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F 本文将参照上文,使用java实现对wikipedia内容进行推荐 找出内容近似的文章,使用的特征为词的tfidf 算法的思想是:在一篇文章中找出那些比较有代表性的词,这些词的tfidf都比较高,形成一个词的向量空间模型 下面的方法就多了,可以直接求两篇原创 2013-12-25 11:40:17 · 635 阅读 · 0 评论 -
文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计
转自:http://blog.csdn.net/yangliuy/article/details/8296481 以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。转载 2013-12-25 15:33:06 · 649 阅读 · 0 评论