最近研究用聚类算法实现日志的分类,在得到结果后准备将结果写入到指定文本是出现了这样的错误:
经过网上多次查询得到了解决方案:
就是在打开一个文本准备写入的同时同样要指定一下字符集。这样他就会以同样的字符集打开你要分析的文本。
总结:
使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的。 很多时候,我们使用了decode和encode&#