训练模型
model = word2vec.Word2Vec(sentences, min_count=1, seed=1, size=100, window=5)
保存模型
txt 格式为可查看模式,若binary=True,mac本地查看文件会乱码
# 保存模型
model.save('text8.model')
# 保存字典
model.save_word2vec_format('word2vec2.vector')
model.save_word2vec_format('word2vec2.bin')
model.wv.save_word2vec_format('word2vec2.txt', binary=False)
获取w2v 字典的key和对应向量
vocab = model.wv.index2word # ndarray 格式
embeddings = model.wv.vectors # ndarray 格式
加载模型
import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('word2vec2.txt', binary=False)
REF: https://blog.csdn.net/leo_95/article/details/93008210