word2vec.load()报错的解决方法

最新推荐文章于 2023-10-26 10:06:42 发布

林林林林林林林林林林林林

最新推荐文章于 2023-10-26 10:06:42 发布

阅读量6.2k

点赞数 8

文章标签： python 自然语言处理

本文链接：https://blog.csdn.net/ouyang953517554/article/details/113246843

版权

很感谢 https://www.cnpython.com/qa/49234.终于解决问题了。记录一下。
在网上找了一些大的词向量模型，load的时候一直报错：

# 最初使用的load方式
from gensim.models import Word2Vec
model = Word2Vec.load('./model/baike_26g_news_13g_novel_229g.model')

load .model后缀时报一下错：

AttributeError: 'EuclideanKeyedVectors' object has no attribute 'negative'

查资料说换成.bin后缀的就行了，结果又报错：

_pickle.UnpicklingError: invalid load key, '6'.

中间又改了些什么，报错：

AttributeError: 'Word2VecKeyedVectors' object has no attribute 'vocabulary'

最后将代码改成下面这样，好了。

from gensim import models
model = models.KeyedVectors.load_word2vec_format('./model/word2vec_779845.bin', binary=True)

原因：
为了在不同的训练算法（Word2Vec、Fastext、WordRank、VarEmbed）之间共享词向量查询代码，作者将词向量的存储和查询分离到一个单独的类keyedvorters中。将word2vec类中的两个方法和几个属性弃用了。

old	new
Word2Vec.load_word2vec_format	KeyedVectors.load_word2vec_format
word2vec_model.save_word2vec_format	word2vec_model.wv.save_word2vec_format
model.syn0norm	model.wv.syn0norm
model.syn0	model.wv.syn0
model.vocab	model.wv.vocab
model.index2word	model.wv.index2word

关注