- 博客(3)
- 资源 (1)
- 收藏
- 关注
转载 自然语言处理之PLSA
本文介绍的PLSA(Probabilistic Latent Semantic Analysis, 概率潜在语义分析)由LSA发展而来。LSA使用线性代数方法,对document-word矩阵进行SVD分解。PLSA则使用了一个概率图模型,引入了一个隐变量topic(可以认为是文档的主题),然后进行统计推断。 为何提出PLSA 在语义分析问题中,存在同义词和一词多义这两个严峻的问题,L
2016-07-08 10:35:41 1065
转载 自然语言处理之LSA
什么是LSA LSA(Latent Semantic Analysis), 潜在语义分析。试图利用文档中隐藏的潜在的概念来进行文档分析与检索,能够达到比直接的关键词匹配获得更好的效果。 关键词匹配进行文档检索有何问题? 现在我们考虑检索问题,我们要从一些文档(可以是一句话、一个段落或一篇文章)中检索出我们想要的文档,可以想到的最简单的方法就是关键词匹配,即哪篇文档包含我们检索使用
2016-07-08 10:33:25 1480
转载 自然语言处理之LDA
LDA由PLSA发展而来,PLSA由LSA发展而来,同样用于隐含语义分析,这里先给出两篇实现LSA和PLSA的文章链接。 我们知道,PLSA也定义了一个概率图模型,假设了数据的生成过程,但是不是一个完全的生成过程:没有给出先验。因此PLSA给出的是一个最大似然估计(ML)或者最大后验估计(MAP)。 LDA拓展了PLSA,定义了先验,因此LDA给出的是一个完整的贝叶斯估计。 详情点击链接查看
2016-07-08 10:31:29 922
xls导入Mysql(PHP程序)
2011-04-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人