Latent Semantic Analysis (LSA) 模型 学习笔记

本文介绍了LSA(Latent Semantic Analysis)模型,探讨了其在文本挖掘中的应用,如解决一词多义问题。通过奇异值分解(SVD)进行降维,构建低维隐含语义空间。同时,总结了LSA模型的优缺点,包括降维效果及SVD计算的耗时问题。
摘要由CSDN通过智能技术生成

Latent Semantic Analysis (LSA) 模型 学习笔记

    

    Latent Semantic Analysis 模型,隐性语义分析,也就是我们常说的LSA模型。后面还有他的兄弟PLSA和LDA模型,这个我们后面再说。这几个都是NLP中比较经典的模型!学习这个模型,主要总结到了三个方面:LSA模型可以应用在哪儿?LSA的理论部分,以及LSA的优缺点分析。


1. LSA的应用


    LSA可以在VSM中降低样本的维度,并且可以从文本中发现隐含的语义维度。

   在VSM中,文档被表示成由特征词出现的概率组成的多位向量,这个方法的好处就是可以把一个文本转化成数值向量,然后做一些相似度计算,聚类分类等等。

    但是,在VSM中,无法处理一词多义和一义多词问题。例如,在VSM模型中,“被子”和“被褥”是两个完全不同的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值