训练词向量

最新推荐文章于 2023-10-12 00:17:27 发布

自塾

最新推荐文章于 2023-10-12 00:17:27 发布

阅读量206

点赞数

分类专栏：自然语言处理文章标签：自然语言处理

本文链接：https://blog.csdn.net/weixin_43320381/article/details/104402814

版权

自然语言处理专栏收录该内容

7 篇文章 0 订阅

订阅专栏

训练一个词向量，输入是一个txt文档，这个txt文档需要已经分好了词。只需要几行代码就能得到训练好的词向量。

import multiprocessing
采用并行计算
from gensim.models import Word2Vec
from gensim.models.word2vec import LineSentence
inp = 'corpus_zh.txt' #这个TXT文档需要放在当前目录
model = Word2Vec(LineSentence(inp), size = 100, window = 5, min_count = 5, workers = multiprocessing.cpu_count())
#上面的size表示要生成100维的向量
model.save('zh-model') #把训练好的模型保存在当前目录

如果下次要把训练好的模型载入，只需要：

from gensim.models import Word2Vec
model = Word2Vec.load('./zh-model')

训练词向量就是这么简单粗暴

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

自塾

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
训练词向量

训练一个词向量，输入是一个txt文档，这个txt文档需要已经分好了词。只需要几行代码就能得到训练好的词向量。import multiprocessing采用并行计算from gensim.models import Word2Vecfrom gensim.models.word2vec import LineSentenceinp = 'corpus_zh.txt' #这个TXT文档需要...
复制链接

扫一扫