运用gensim三种不同格式的词向量的保存与加载

最新推荐文章于 2023-05-12 10:50:27 发布

小邓不自满

最新推荐文章于 2023-05-12 10:50:27 发布

阅读量2k

点赞数 1

分类专栏： python 文章标签： gensim

本文链接：https://blog.csdn.net/weixin_42968194/article/details/102415737

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、了解gensim训练词向量
利用gensim.models.Word2Vec(sentences)建立词向量模型
三步实现：建立一个空的模型对象，遍历一次语料库建立词典，第二次遍历语料库建立神经网络模型。可以通过分别执行
model=gensim.models.Word2Vec()
model.build_vocab(sentences)
model.train(sentences)
也可以直接一步实现
gensim.models.Word2Vec()

二、保存的方式
1、
以model.save()方法保存词向量
保存词向量
…
import gensim
model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10)
model.save("./models/Word2vec.w2v")
…
加载词向量
‘’’
import gensim
word2vec = gensim.models.word2vec.Word2Vec.load("./models/Word2vec.w2v")
‘’’
2、保存为二进制的词向量
import gensim
model.wv.save_Word2Vec_format(embedding_path,binary=True)

加载
word2vec = gensim.models.KeyedVectors.load_word2vec_format(embedding_path,binary=True)

3、使用numpy进行保存和加载
np.save()保存npy文件，np.load()加载npy文件。

调用请看
https://blog.csdn.net/xuxiatian/article/details/88576454
https://blog.csdn.net/orangefly0214/article/details/90518229

小邓不自满

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
运用gensim三种不同格式的词向量的保存与加载

一、了解gensim训练词向量利用gensim.models.Word2Vec(sentences)建立词向量模型三步实现：建立一个空的模型对象，遍历一次语料库建立词典，第二次遍历语料库建立神经网络模型。可以通过分别执行model=gensim.models.Word2Vec()model.build_vocab(sentences)model.train(sentences)也可以直...
复制链接

扫一扫