在做文本情感分类的项目,研究到Word2Vec模型了。
自己来实践一下,网上大多数代码经过时间的流逝,多多少少都出了点小问题,为了方便自己之后的学术垃圾的制造,把自己跑出来的,修改过的代码和方法记录一下。
1.环境
1.1环境配置
Python3.9,Pycharm2021
1.2需要的库(搭建的虚拟环境,直接通过File->Settings引入)
import logging
from gensim.corpora import WikiCorpus
import jieba
import logging
from gensim.models import word2vec
import warnings
import os.path
import sys
import multiprocessing
from gensim.models.word2vec import LineSentence
1.3Opencc简繁置换插件
根据以下这篇博文的内容进行安装和操作即可。