很感谢 https://www.cnpython.com/qa/49234.终于解决问题了。记录一下。
在网上找了一些大的词向量模型,load的时候一直报错:
# 最初使用的load方式
from gensim.models import Word2Vec
model = Word2Vec.load('./model/baike_26g_news_13g_novel_229g.model')
load .model后缀时报一下错:
AttributeError: 'EuclideanKeyedVectors' object has no attribute 'negative'
查资料说换成.bin后缀的就行了,结果又报错:
_pickle.UnpicklingError: invalid load key, '6'.
中间又改了些什么,报错:
AttributeError: 'Word2VecKeyedVectors' object has no attribute 'vocabulary'
最后将代码改成下面这样,好了。
from gensim import models
model = models.KeyedVectors.load_word2vec_format('./model/word2vec_779845.bin', binary=True)
原因:
为了在不同的训练算法(Word2Vec、Fastext、WordRank、VarEmbed)之间共享词向量查询代码,作者将词向量的存储和查询分离到一个单独的类keyedvorters中。将word2vec类中的两个方法和几个属性弃用了。
old | new |
---|---|
Word2Vec.load_word2vec_format | KeyedVectors.load_word2vec_format |
word2vec_model.save_word2vec_format | word2vec_model.wv.save_word2vec_format |
model.syn0norm | model.wv.syn0norm |
model.syn0 | model.wv.syn0 |
model.vocab | model.wv.vocab |
model.index2word | model.wv.index2word |