今天在用python2.7 读取CSV文件时,进行字符串合并提示:
UnicodeDecodeError: 'ascii' codec can't decode byte ....
是数据编码与python自身编码不匹配。
在网上查了一些资料提示解决办法为再头部加上如下代码:
#-*- encoding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
结果仍然提示以下错误信息:
UnicodeDecodeError: 'utf8' codec can't decode ...... invalid start byte
最后尝试了半天,发现读出的中文数据是GBK编码的,只要把字符串decode成gbk即可
s.decode('gbk') 不再提示错误