隐含语义索引（Latent Semantic Indexing ）

最新推荐文章于 2021-02-18 15:45:18 发布

花折泪

最新推荐文章于 2021-02-18 15:45:18 发布

阅读量2.6k

点赞数

分类专栏： machine learning 文章标签：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013802188/article/details/40903471

版权

machine learning 专栏收录该内容

20 篇文章 3 订阅

订阅专栏

向量空间模型（Vector Space Model）

将文本看作是一个向量，向量中的每一维都代表某单词是否出现在文本中，使用向量空间模型的pca算法时并不做规约化，因为文本里的每一条不一定有同等的作用。向量空间中紧挨着的文本，我们认为他们讨论的是同一类的问题：

其中有三个基础的性质：

1. d1挨着d2，那么d2挨着d1

2. d1挨着d2，d2挨着d3，那么d1离d3不远

3. d离d最近

向量d1与d2的距离由他们的夹角的余弦值决定：

以长度为标准来区分向量的每一个成分，我们使用2阶范数：

也就是讲向量映射到闭单位球里，然后：

所以更长的文本不会有更多的权重。

我们定义两个向量的相似度：

三角不等式：

在欧几里得空间：

但是在语义空间中这个法则不成立：

下面是三个例子：

当然，将高维的特征空间映射到低维的特征空间使用的依然是SVD，设计一个映射来反应低维空间的语义关联，然后再通过度量文本的相似度进行学习。一个例子来阐述隐含语义空间：

通过SVD，A的每一行每一列都映射到了k维的LSI空间了。我们的目标q也映射到这个空间里：

要注意q不是一个稀疏的向量。

下面是一个文档矩阵：

C = UΣVT，其中U Σ V^T为：

降维之后：

原始矩阵C与降维之后的C2进行对比：

其中，d2与d3在原始空间的相似度为0，在降维空间的相似度为0.52 ∗ 0.28 + 0.36 ∗ 0.16 + 0.72 ∗ 0.36 + 0.12 ∗ 0.20 + −0.39 ∗ −0.08 ≈ 0.52

LSI提高了精度，然而却在否定句，布尔问句等问题中表现很差。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
隐含语义索引（Latent Semantic Indexing ）

向量空间模型（Vector Space Model）将文本看作是一个向量，向量中的每一维都代表某单词是否出现在文本中，使用向量空间模型的pca算法时并不做规约化，因为文本里的每一条不一定有同等的作用。向量空间中紧挨着的文本，我们认为他们讨论的是同一类的问题：其中有三个基础的性质：1. d1挨着d2，那么d2挨着d12. d1挨着d2，d2挨着d3，那么d
复制链接

扫一扫

专栏目录

花折泪 CSDN认证博客专家 CSDN认证企业博客

码龄10年

60: 原创

18万+: 周排名

32万+: 总排名

14万+: 访问

: 等级

1651: 积分

51: 粉丝

52: 获赞

21: 评论

164: 收藏

私信

关注

热门文章

分类专栏

acm 46篇
opencv 1篇
database
machine learning 20篇

最新评论

独立成分分析（Independent Components Analysis）
WangNa434: 写得太好了，请问最后的例子如何实现？？
1008. 数组元素循环右移问题 (20)
qq_36037874: 大佬思路确实厉害。不过前几种用string实现的方式似乎只能处理个位数，无法处理两位数以上的情况吧。而题目要求的是正整数这个域。
1008. 数组元素循环右移问题 (20)
RyanBronx: 太厉害了
坐标下降法(Coordinate descent)
有硬币就是土豪: 剽窃都不注明出处！这些图，公式都是博主自己打的吗
坐标下降法(Coordinate descent)
我的心永远是冰冰哒: 您好，我有一个问题想请教一下，就在开始证明的最后的那个部分(我没法加入图片，图片网址是https://img-blog.csdn.net/20141026151628490?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast），f(y）-f(x)的那一步，我能看懂g(y)>g(x),为什么有h(y_i)>h(x_i),这个是怎么得到的，另外这里的h(x_i)是什么意思，是h(x_i)表示的是一个关于分量x_i的凸函数吗？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。