问题:用python读取数据库中的UTF-8编码的中文字段,返回乱码。系统的locale也是设置为UTF-8。
解决:在数据库链接时,需要指定编码方式charset为UTF8。
刚开始用UTF-8,提示“"Can't initialize character set UTF-8 (path: /usr/share/mysql/charsets/)”。
原因没有深究。
编码正确后,报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position”
python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错
UnicodeDecodeError: 'ascii' codec can't encode characters in position...。
python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置为utf8的编码格式。
解决:在python文件的开头处添加下面两行代码:
reload(sys)
sys.setdefaultencoding('utf8')