报错
文章平均质量分 57
half_words
BIT CS硕士在读
展开
-
whl安装/ pkuseg分词/ spacy-pkuseg
回顾一下刚才做了什么jieba分词正常使用就可以输出到csv和excel中也很方便import csv / import xlwt写到csv中可能出现中文乱码所以打开的时候用f=codecs.open(…) #import codecspkuseg分词pip install pkuseg的时候一直断,但httperror毕竟是网络的问题,可能是连上清华源不稳定,所以重试就可以。但网络稳定的时候也没有安装成功,后来查看了pkuseg-PyPI,这里需要注意几点:附上帮助到我的博客:使.原创 2021-01-22 13:34:00 · 2214 阅读 · 8 评论 -
UnicodeDecodeError: gbk codec cannot decode byte 0xaf in position 92: illegal multibyte sequence解决
使用python在open文件时出现此类报错:表明文件中存在非法字符。可以使用error='ignore’来忽略掉非法字符。f = open(filepath, ‘a+’, encoding=‘UTF-8’)改为:f = open(filepath, ‘a+’, encoding=‘UTF-8’,error=‘ignore’)即可。当然,忽略掉非法字符可能会带来内容的影响。(在博主写的程序中没有明显影响,建议酌情使用)...原创 2020-05-28 23:05:42 · 1078 阅读 · 0 评论