【问题解决】转载:如何应对爬虫中ascii编码问题
原出处:https://www.cnblogs.com/xiangwb/p/10853612.html
最近在使用python进行爬虫时,抓取的数据格式是ASCII编码,网页源码数据是
“\u6697\u88d4\u5251\u9b54”
由于在python中”\”代表转义字符,所以在 python 中会显示这样:
“\u6697\u88d4\u5251\u9b54”
如何将其转为中文呢?
name = "\\u6697\\u88d4\\u5251\\u9b54"
name =name.encode('ascii').decode('unicode_escape') # encode()可以添加'ascii',也可以不加
print(name) # 然后成功返回中文 '暗夜剑魔'