编解码问题:'gbk' codec can't decode byte 0xb5
今天抓取数据时,对抓取的数据进行处理时发现是乱码,如图所示:
使用gbk和utf-8对其进行编解码,发现还是有问题,后来去查阅了相关资料,发现是编解码的问题,gbk对有些汉字的字符无法识别所以就会报错:
原因:
网页的原数据中有法语等特殊语法字符,Gbk和utf-8无法识别
解决方法:
使用unicode_escape进行编码
编解码问题:'gbk' codec can't decode byte 0xb5
今天抓取数据时,对抓取的数据进行处理时发现是乱码,如图所示:
使用gbk和utf-8对其进行编解码,发现还是有问题,后来去查阅了相关资料,发现是编解码的问题,gbk对有些汉字的字符无法识别所以就会报错:
原因:
网页的原数据中有法语等特殊语法字符,Gbk和utf-8无法识别
解决方法:
使用unicode_escape进行编码