自然语言处理
半音banyin
这个作者很懒,什么都没留下…
展开
-
python GENSIM训练word2vec流程及遇到问题详解
训练流程1.如果是通用预料,下载,提取json数据中的title和txt字段内容。2.将提取的内容去除符号等3.分词:直接调用jieba分词4.去停用词。模型训练model = gensim.models.Word2Vec(data, size=100, min_count=1, window=5)model.save(u'word2vec.model') #将...原创 2020-04-07 18:55:38 · 1508 阅读 · 0 评论 -
gensim安装教程
1.安装numpy-1.14.5+mkl-cp37-cp37m-win_amd64.whl ,安装该包前需要卸载numpy,cp后面的数字和python版本对应。安装成功如下图:2.安装scipy-1.1.0-cp37-cp37m-win_amd64.whl,方法同上。3.由于官方gensim下载太慢,我在国内镜像安装,安装命令:pip install -i https://p...原创 2020-03-31 23:37:00 · 6664 阅读 · 1 评论