基于WIKI中文语料·Word2Vec模型训练·Python

在做文本情感分类的项目,研究到Word2Vec模型了。自己来实践一下,网上大多数代码经过时间的流逝,多多少少都出了点小问题,为了方便自己之后的学术垃圾的制造,把自己跑出来的,修改过的代码和方法记录一下。1.环境1.1环境配置Python3.9,Pycharm20211.2需要的库(搭建的虚拟环境,直接通过File->Settings引入)import loggingfrom gensim.corpora import WikiCorpusimport jiebaimpo
摘要由CSDN通过智能技术生成

在做文本情感分类的项目,研究到Word2Vec模型了。

自己来实践一下,网上大多数代码经过时间的流逝,多多少少都出了点小问题,为了方便自己之后的学术垃圾的制造,把自己跑出来的,修改过的代码和方法记录一下。

1.环境

1.1环境配置

Python3.9,Pycharm2021

1.2需要的库(搭建的虚拟环境,直接通过File->Settings引入)

import logging
from gensim.corpora import WikiCorpus
import jieba
import logging
from gensim.models import word2vec
import warnings
import os.path
import sys
import multiprocessing
from gensim.models.word2vec import LineSentence

1.3Opencc简繁置换插件

根据以下这篇博文的内容进行安装和操作即可。

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值