在python中解码中文的时候,可能报以下错误:
data.decode('gbk');
'gbk' codec can't decode bytes in position xxx illegal multibyte ...
可以尝试把gbk换成'GB18030'
因为gbk相对于gb2312包含的字符更多,但是GB18030包含的字符数又大于gbk.所以试试GB18030
题外话,按照一些理论GB18030有的时候也不好用。
最好的办法就是在所有的程序设计和编码的时候使用utf-8.