狄利克雷分布公式_LSA潜在语义分析的原理、公式推导和应用

83882ba5614735548aad8a248ca6efd2.png

潜在语义分析(Latent Semantic Analysis,LSA)模型, 也称LSI( Latent Semantic Indexing)。

LSA主要用于文本的主题提取,挖掘文本背后的含义、数据降维等。

本文先介绍向量空间模型(Vector Space Model, VSM)、奇异值分解等基本概念;接着,引出潜在语义分析(Latent Semantic Analysis,LSA)模型及其原理;然后,介绍LSA的相关工具,及在文本主题提取上的应用;最后,对LSA进行总结,指出LSA的本质、优缺点和发展历程。主要目录如下:

一、LSA基础
1、VSM模型
2、奇异值分解
3、截断奇异值分解
二、LSA原理
1、话题向量空间
2、LSA提出
3、LSA原理
三、LSA应用
1、LSA工具
2、LSA挖掘主题
四、LSA总结
1、LSA的本质
2、LSA的优缺点
3、LSA的发展

直接上PPT。

e42a6e9c4a0d0303f780c3eb41035278.png
LSA潜在语义分析的原理、公式推导和应用

一、LSA基础

e1e30337e8b7cdbccbc45916abb5be26.png
LSA基础的目录

1、VSM模型

1975年,G. Salton等在论文《A Vector Space Model for Automatic Indexing》提出向量空间模型(Vector Space Model, VSM)。

873663822cc87edeea3fb24934e92bee.png
VSM模型

VSM的基本思想:把一个文本映射成词向量,多个文本构成词向量空间。

147fffd7400035a3c4203be102235593.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值