前段时间,写了个爬虫去爬取一些手机的价格,用的是decode('gbk')这一方法来解码。
后来发现有些解码会失败,于是换成了下面这种形式:
如 str= '\xbb\xaa\xce\xaaMate 9\xa3\xa8MHA-AL00/4GB RAM/\xc8\xab\xcd\xf8\xcd\xa8\xa3\xa9'
则 b = repr(str)
print unicode(eval(b),"gbk")
即可得到结果..
前段时间,写了个爬虫去爬取一些手机的价格,用的是decode('gbk')这一方法来解码。
后来发现有些解码会失败,于是换成了下面这种形式:
如 str= '\xbb\xaa\xce\xaaMate 9\xa3\xa8MHA-AL00/4GB RAM/\xc8\xab\xcd\xf8\xcd\xa8\xa3\xa9'
则 b = repr(str)
print unicode(eval(b),"gbk")
即可得到结果..
转载于:https://my.oschina.net/lonelycode/blog/901608