gensim w2v 使用记录

训练模型

model = word2vec.Word2Vec(sentences, min_count=1, seed=1, size=100, window=5)

保存模型

txt 格式为可查看模式,若binary=True,mac本地查看文件会乱码

# 保存模型
model.save('text8.model')  

# 保存字典
model.save_word2vec_format('word2vec2.vector')
model.save_word2vec_format('word2vec2.bin')
model.wv.save_word2vec_format('word2vec2.txt', binary=False)

获取w2v 字典的key和对应向量

vocab = model.wv.index2word # ndarray 格式
embeddings = model.wv.vectors # ndarray 格式

加载模型

import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('word2vec2.txt', binary=False)

REF: https://blog.csdn.net/leo_95/article/details/93008210

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值