Linux ubuntu下python处理中文(汉字及标点)的编码设置
在NLP的相关任务中,应用python处理中文是很常见的。在这个过程中,由于编码方式的不一致,可能会出现以下两种错误:1)SyntaxError: Non-ASCII character in file ‘文件名’2)UnicodeDecodeError: 'ascii' codec can't decode解决方法是:更改Python的编码方式为utf8模式,分为单文档内的临时更改,以及全局更...
原创
2018-03-04 22:23:52 ·
8110 阅读 ·
0 评论