自然语言处理
文章平均质量分 54
一不小心误入此门
Sun_Sherry
这个作者很懒,什么都没留下…
展开
-
Gensim:问题汇总
问题描述:使用LineSentence()方法读取分词后的的文件时,由于文件保存时用的是"ANSI"编码,导致在读文件并训练word2vec时报UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc4 in position 0: invalid continuation byte.具体如下:from gensim.models import Word2Vec,word2vecimport multiprocessingsentences=li原创 2022-03-18 11:40:50 · 544 阅读 · 0 评论 -
pyhanlp包的安装
1. Windows下安装pyhanlppip install pyhanlp:报错内容如下error: Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools”: https://visualstudio.microsoft.com/visual-cpp-build-tools/原创 2021-09-30 11:03:35 · 910 阅读 · 0 评论