NLP
fantisGod
这个作者很懒,什么都没留下…
展开
-
NLP 之 topic model
转自: http://stblog.baidu-tech.com/?p=1190摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的转载 2012-12-11 22:31:37 · 1547 阅读 · 0 评论 -
隐性语义索引
1. 引言 自然语言文本中的词汇(术语)具有一词多义(polysemy)和一义多词(synonymy)的特点. 由于一词多义, 基于精确匹配的检索算法会报告许多用户不要的东西; 由于一义多词, 基于精确匹配的检索算法又会遗漏许多用户想要的东西.下面是一个例子:设Doc1, Doc2, Doc3是三个文件. 一些术语在这三个文件中的出现情况如下表:转载 2013-05-10 15:02:55 · 816 阅读 · 0 评论 -
隐马尔科夫模型详解
转载请注明地址(http://blog.csdn.net/xinzhangyanxiang/article/details/8522078)学习概率的时候,大家一定都学过马尔科夫模型吧,当时就觉得很有意思,后来看了数学之美之隐马模型在自然语言处理中的应用后,看到隐马尔科夫模型竟然能有这么多的应用,并且取得了很好的成果,更觉的不可思议,特地深入学习了一下,这里总结出来。马尔科夫过程转载 2015-01-30 15:24:33 · 29871 阅读 · 1 评论