中文编码一直是一个让人头疼的问题,这里记录一下几个自己最近用的解决方案:
方案一:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
这个是自己写爬虫的时候,爬中文总是遇到各种鬼问题,加了这几行,就正确了
方案二
从网上下载了一个Excel表格,里面的中文用程序一读全部乱码,encoding加进去也会报错,后来尝试了一种方式:
- 另存为x.csv文件
- Notepad里面新创建一个csv文件,默认编码是utf8无BOM,之后再把x.csv里面的文件复制粘贴到新的csv里面,编码正常啦!
感觉这个方案机智得不行,哈哈
方案三
这个方案主要针对print到控制台出现乱码的情况,且需要辅助方案一才能起到相应的效果。
aList[1].decode(encoding="utf-8")