有时候需要从一个文件中读数据,然后把这些数据加工处理后写入另外一个文件中,这个过程就有可能出现字符编码问题。比如读取一个xml文件,有的字段值读出是asci码,有的就是unicode编码,当把这些不同编码的数据合并在一起处理的时候,就会出现问题。所以在处理文档时,有必要统一字符编码。一个可行的办法就是添加如下代码:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
这样在处理编码不同的字符时,就会统一转成utf8编码处理。
另附一个处理此问题的办法,是在python的库文件中设置,不过这样会有代码移植性问题。
转载:http://blog.csdn.net/lgy807720302/article/details/7515743