doc2vec的基于新文本内容的增量训练方案

最新推荐文章于 2024-04-14 22:38:53 发布

DerrickOzil

最新推荐文章于 2024-04-14 22:38:53 发布

阅读量6k

点赞数 1

分类专栏：自然语言处理文章标签：自然语言处理 nlp 相似性计算情感分类

本文链接：https://blog.csdn.net/jackmcgradylee/article/details/77853192

版权

在线上使用doc2vec训练时，经常需要实时的更新模型，训练新的语料和句向量，来进行接下来的文本相似度、情感分析等工作。下面的代码简单概括了doc2vec的增量训练方案。

# @author：DerrickOzil
# date: 2017-09-04
# -*- coding: utf-8 -*-
import sys 
import gensim
import os
from gensim.models.doc2vec import Doc2Vec
reload(sys)
sys.setdefaultencoding('utf-8')

TaggededDocument = gensim.models.doc2vec.TaggedDocument

#获取语料集合
def get_datasest

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DerrickOzil

关注关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
7
评论
doc2vec的基于新文本内容的增量训练方案

在线上使用doc2vec训练时，经常需要实时的更新模型，训练新的语料和句向量，来进行接下来的相似度、情感分析等工作。下面的代码简单概括了doc2vec的增量训练方案。# @author：DerrickOzil# -*- coding: utf-8 -*-import sys import gensimimport osfrom gensim.models.doc2vec import Do
复制链接

扫一扫