运用gensim三种不同格式的词向量的保存与加载

一、了解gensim训练词向量
利用gensim.models.Word2Vec(sentences)建立词向量模型
三步实现:建立一个空的模型对象,遍历一次语料库建立词典,第二次遍历语料库建立神经网络模型。可以通过分别执行
model=gensim.models.Word2Vec()
model.build_vocab(sentences)
model.train(sentences)
也可以直接一步实现
gensim.models.Word2Vec()

二、保存的方式
1、
以model.save()方法保存词向量
保存词向量

import gensim
model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10)
model.save("./models/Word2vec.w2v")

加载词向量
‘’’
import gensim
word2vec = gensim.models.word2vec.Word2Vec.load("./models/Word2vec.w2v")
‘’’
2、保存为二进制的词向量
import gensim
model.wv.save_Word2Vec_format(embedding_path,binary=True)

加载
word2vec = gensim.models.KeyedVectors.load_word2vec_format(embedding_path,binary=True)

3、使用numpy进行保存和加载
np.save()保存npy文件,np.load()加载npy文件。

调用请看
https://blog.csdn.net/xuxiatian/article/details/88576454
https://blog.csdn.net/orangefly0214/article/details/90518229

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值