狄利克雷分布公式_LSA潜在语义分析的原理、公式推导和应用

LSA(潜在语义分析)是一种文本分析技术,涉及向量空间模型、奇异值分解和矩阵分解。通过LSA,可以进行文本主题提取和数据降维。本文介绍了LSA的基础概念,包括VSM模型和奇异值分解,并详细阐述了LSA的原理和在文本挖掘中的应用。同时,讨论了LSA的本质、优缺点及其发展历程。
摘要由CSDN通过智能技术生成

83882ba5614735548aad8a248ca6efd2.png

潜在语义分析(Latent Semantic Analysis,LSA)模型, 也称LSI( Latent Semantic Indexing)。

LSA主要用于文本的主题提取,挖掘文本背后的含义、数据降维等。

本文先介绍向量空间模型(Vector Space Model, VSM)、奇异值分解等基本概念;接着,引出潜在语义分析(Latent Semantic Analysis,LSA)模型及其原理;然后,介绍LSA的相关工具,及在文本主题提取上的应用;最后,对LSA进行总结,指出LSA的本质、优缺点和发展历程。主要目录如下:

一、LSA基础
1、VSM模型
2、奇异值分解
3、截断奇异值分解
二、LSA原理
1、话题向量空间
2、LSA提出
3、LSA原理
三、LSA应用
1、LSA工具
2、LSA挖掘主题
四、LSA总结
1、LSA的本质
2、LSA的优缺点
3、LSA的发展

直接上PPT。

e42a6e9c4a0d0303f780c3eb41035278.png
LSA潜在语义分析的原理、公式推导和应用

一、LSA基础

e1e30337e8b7cdbccbc45916abb5be26.png
LSA基础的目录

1、VSM模型

1975年,G. Salton等在论文《A Vector Space Model for Automatic Indexing》提出向量空间模型(Vector Space Model, VSM)。

873663822cc87edeea3fb24934e92bee.png
VSM模型

VSM的基本思想:把一个文本映射成词向量,多个文本构成词向量空间。

147fffd7400035a3c4203be102235593.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值