算法学习（十四）——word2vec

最新推荐文章于 2022-02-10 13:32:16 发布

星之所望

最新推荐文章于 2022-02-10 13:32:16 发布

阅读量138

点赞数

分类专栏：强化学习文章标签：算法 word2vec 机器学习

本文链接：https://blog.csdn.net/weixin_42769131/article/details/114457116

版权

强化学习专栏收录该内容

42 篇文章 19 订阅

订阅专栏

个人理解：就是获取一个没有偏置和激活函数的全连接隐层，将高维的one-hot数据转变为稠密、低维、有相似性的关系的矩阵，分为CBOW, skip-gram两种方法。

参考：

https://www.zhihu.com/question/45027109

https://www.jianshu.com/p/9eab3894ae8a

什么是 word embedding? - Scofield的回答 - 知乎 https://www.zhihu.com/question/32275069/answer/301428835

代码：

from gensim.models import word2vec
  sentences = word2vec.Text8Corpus("C:/traindataw2v.txt")  # 加载语料
  model = word2vec.Word2Vec(sentences, size=200)  # 训练skip-gram模型; 默认window=5
  #获取“学习”的词向量
  print("学习：" + model["学习"])
  # 计算两个词的相似度/相关程度
  y1 = model.similarity("不错", "好")
  # 计算某个词的相关词列表
  y2 = model.most_similar("书", topn=20)  # 20个最相关的
  # 寻找对应关系
  print("书-不错，质量-")
  y3 = model.most_similar(['质量', '不错'], ['书'], topn=3)
  # 寻找不合群的词
  y4 = model.doesnt_match("书 书籍 教材 很".split())
  # 保存模型，以便重用
  model.save("db.model")
  # 对应的加载方式
  model = word2vec.Word2Vec.load("db.model")

星之所望

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法学习（十四）——word2vec

个人理解：就是获取一个没有偏置和激活函数的全连接隐层，将高维的one-hot数据转变为稠密、低维、有相似性的关系的矩阵，分为CBOW, skip-gram两种方法。参考：https://www.zhihu.com/question/45027109https://www.jianshu.com/p/9eab3894ae8ahttps://www.bilibili.com/video/BV1Lb411p7FD代码：from gensim.models import word2vec
复制链接

扫一扫