r = "中文"
print(r, type(r)) # "中文" <class 'str'>
r = r.encode("utf-8")
print(r, type(r)) # b'\xe4\xb8\xad\xe6\x96\x87' <class 'bytes'>
r = r.decode("utf-8")
print(r, type(r)) # "中文" <class 'str'>
print("#####################")
r = "中文"
print(r, type(r)) # "中文" <class 'str'>
r = r.encode("gbk")
print(r, type(r)) # b'\xe4\xb8\xad\xe6\x96\x87' <class 'bytes'>
r = r.decode("gbk")
print(r, type(r)) # "中文" <class 'str'>
print("#####################")
a = "你好".encode("unicode-escape")
print(a, type(a)) # b'\\u4f60\\u597d' <class 'bytes'>
a = a.decode("unicode-escape")
print(a, type(a)) # 你好 <class 'str'>
解决办法
r.decode("unicode-escape") #将unicode编码的字节内容, 解码为字符串格式。
参考:
Python使用request.get函数,返回的网页内容为UNCOIDE编码,中文出现乱码解决方案_python requests.get 返回全是乱码-CSDN博客