95、自然语言处理svd词向量

最新推荐文章于 2023-01-01 14:50:40 发布

置顶香港胖仔

最新推荐文章于 2023-01-01 14:50:40 发布

阅读量1.3k

点赞数

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/u012416045/article/details/78223828

版权

自然语言处理专栏收录该内容

10 篇文章 1 订阅

订阅专栏

 
 
  
  import numpy as np
import matplotlib.pyplot as plt
la = np.linalg
words = ["I","like","enjoy","deep","learning","NLP","flying","."]
X = np.array([[0,2,1,0,0,0,0,0],
              [2,0,0,1,0,1,0,0],
              [1,0,0,0,0,0,1,0],
              [0,1,0,0,1,0,0,0],
              [0,0,0,1,0,0,0,1],
              [0,1,0,0,0,0,0,1],
              [0,0,1,0,0,0,0,1],
              [0,0,0,0,1,1,1,0]])
U,s,Vh=la.svd(X, full_matrices=False)
for i in range(len(words)):
    print(U[i,1],U[i,1],words[i])
    plt.text(U[i,0],U[i,1],words[i])
plt.xlim(-1,1)
plt.ylim(-1,1)
plt.show()
 
 
 
 
  
  这是根据斯坦福cs224d课程写出来的，
这是课程里边最开始所讲的词向量，
1、首先将所有的词组织成一个词典
2、对于词典中的每一个词，
扫描词典中的其他词，
对于扫描到的每一个词，
统计原始词在被扫描到的词的前边或者后边出现的次数，
这样就构成了一个由词频所构成的对角阵
3、对该对角阵进行SVD分解得到
 
 
 
 
  
  得到的U矩阵便是经过降维后的词向量矩阵
将每个词的词向量前两个值画在图中
便得到了如最上面图所示的
词关系图
 
Thanks
WeiZhen

香港胖仔

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
95、自然语言处理svd词向量

import numpy as npimport matplotlib.pyplot as pltla = np.linalgwords = ["I","like","enjoy","deep","learning","NLP","flying","."]X = np.array([[0,2,1,0,0,0,0,0], [2,0,0,1,0,1,0,0],
复制链接

扫一扫