Gensim Word2vec 使用教程

最新推荐文章于 2023-01-22 15:21:14 发布

摇摆的果冻

最新推荐文章于 2023-01-22 15:21:14 发布

阅读量1.4k

点赞数

分类专栏： Pytorch NN

本文链接：https://blog.csdn.net/Z_lbj/article/details/79622534

版权

Pytorch 同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

存储加载模型

model = Word2Vec.load_word2vec_format('/./data/GoogleNews-vectors-negative300.txt', binary=False)
# using gzipped/bz2 input works too, no need to unzip:
model=  Word2Vec.load_word2vec_format('./data/GoogleNews-vectors-negative300.bin', binary=True)

进一步训练

model = gensim.models.Word2Vec.load('/tmp/mymodel')
model.train(more_sentences)

【注意】对C生成的模型不能再进行训练.

获得对应词向量

model['computer']  # raw NumPy vector of a word
array([-0.00449447, -0.00310097,  0.02421786, ...], dtype=float32)

单词相似度的计算

model.most_similar(positive=['woman', 'king'], negative=['man'], topn=1)
[('queen', 0.50882536)]
model.doesnt_match("breakfast cereal dinner lunch".split())
'cereal'
model.similarity('woman', 'man')
.73723527

本文参考http://blog.csdn.net/Star_Bob/article/details/47808499

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

摇摆的果冻

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Gensim Word2vec 使用教程

存储加载模型model = Word2Vec.load_word2vec_format('/./data/GoogleNews-vectors-negative300.txt', binary=False)# using gzipped/bz2 input works too, no need to unzip:model= Word2Vec.load_word2vec_format('./...
复制链接

扫一扫