utf-8 python3_python3解码utf-8明文

最新推荐文章于 2024-03-14 23:11:52 发布

weixin_39637059

最新推荐文章于 2024-03-14 23:11:52 发布

阅读量531

点赞数

文章标签： utf-8 python3

如果遇到 '\\xe4\\xb8\\xad\\xe5\\x9b\\xbd' 这样的utf-8明文字符串，并且不是在代码里，而是从别的地方获取的，无法更改，就需要特殊的解码方式

在python2中，可以直接用decode("string_escape")解决，但是python3中str类型无法decode，那么怎么办呢？

有两种方法，第一种来自stackoverflow

s = r'\xe4\xb8\xad\xe5\x9b\xbd'c= s.encode().decode('unicode-escape').encode('raw_unicode_escape').decode('utf-8')

print(c)

没错，decode('unicode-escape')之后，字符串实际上变成了'\xe4\xb8\xad\xe5\x9b\xbd'，然后就可以用常规的.encode('raw_unicode_escape').decode('utf-8')解决

第二种方法来自知乎

python3的编码有哪些坑？ - 哈哈哈的回答 - 知乎 https://www.zhihu.com/question/60231684/answer/1076033667

s = r'\xe4\xbd\xa0\xe5\xa5\xbd'eval("print('"+s+"'.encode('raw_unicode_escape').decode('utf-8'))")#写成函数

defgetUtf8Escape(s):

d=[]

eval("d.append('" + s + "'.encode('raw_unicode_escape').decode('utf-8'))")returnd[0]print(getUtf8Escape(s))

简单粗暴的方法，但确实有效

顺带一提，如果是Unicode的明文，或者没有\\转义的utf-8，其实很简单

#Unicode明文

a = r'\u8bf7'

b = a.encode().decode("unicode_escape")

print(b)

#utf-8

a = '\xe4\xbd\xa0\xe5\xa5\xbd'

b = a.encode('raw_unicode_escape').decode('utf-8')

print(b)

weixin_39637059

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
utf-8 python3_python3解码utf-8明文

如果遇到'\\xe4\\xb8\\xad\\xe5\\x9b\\xbd' 这样的utf-8明文字符串，并且不是在代码里，而是从别的地方获取的，无法更改，就需要特殊的解码方式在python2中，可以直接用decode("string_escape")解决，但是python3中str类型无法decode，那么怎么办呢？有两种方法，第一种来自stackoverflows = r'\xe4\xb8\xa...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。