我是在网页爬虫中遇到这个问题,尝试了半天,有两种方法,自己总结一下,并分享给大家:
例如:"\u9633" 转化为“阳”
(1)**方法一:**先通过utf-8将其转化为byte,再通过unicode_escape进行解码:
s = '\\u9633' # 第一个\是转义
print(s.encode('utf-8').decode('unicode_escape')) # 阳
需要注意的是:s中第一个反斜杠是用来转义表示第二个反斜杠的,
我是在网页爬虫中遇到这个问题,尝试了半天,有两种方法,自己总结一下,并分享给大家:
例如:"\u9633" 转化为“阳”
(1)**方法一:**先通过utf-8将其转化为byte,再通过unicode_escape进行解码:
s = '\\u9633' # 第一个\是转义
print(s.encode('utf-8').decode('unicode_escape')) # 阳
需要注意的是:s中第一个反斜杠是用来转义表示第二个反斜杠的,