自然语言处理之话题建模:Latent Semantic Analysis (LSA):LSA的优化与改进
自然语言处理之话题建模:Latent Semantic Analysis (LSA)
LSA基础理论
LSA的数学基础
Latent Semantic Analysis (LSA) 是一种基于统计的方法,用于分析文本集合中的语义结构。LSA 的核心是通过矩阵分解技术,将文档-词矩阵转换为一个低维的语义空间,从而捕捉到词与词、文档与文档之间的潜在关联。
矩阵分解
LSA 使用奇异值分解(SVD)来实现矩阵分解。假设我们有一个文档-词矩阵 A