Python 'unicode_escape'

最新推荐文章于 2022-05-01 15:06:24 发布

zzzz_123123

最新推荐文章于 2022-05-01 15:06:24 发布

阅读量3.7k

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzzz_123123/article/details/85225819

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.

a=‘\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5317\u4eac\uff09\u6709\u9650\u516c\u53f8’
>>> print unicode(a,'utf-8')
\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5317\u4eac\uff09\u6709\u9650\u516c\u53f8
>>> print(a.decode('unicode_escape'))

百度在线网络技术（北京）有限公司

“反编码”我自己起的名字，大概意思就是我得到一串字符，是unicode码，如：‘\u53eb\u6211’，进行反编码后得到其对应的汉字。

2.

print u"中".encode("unicode-escape")

\u4e2d

这里是将“中”的unicode编码值（4E2D）输出。

3.

string-escape是对二进制的字节流，一个字节一个字节转义，并对每个字节以16进制输出，比如：

In [22]: print "中".encode("string-escape")

\xe4\xb8\xad #注意，这是一个字符串'\\xe4\\xb8\\xad'

这里是将"中"的utf-8编码值（E4B8AD）输出成一个可见字符串。

In [72]: "中".encode("string-escape")

Out[72]: '\\xe4\\xb8\\xad'

In [64]: u"中".encode("gbk").encode("string-escape")

Out[64]: '\\xd6\\xd0'

这里是将“中”以gbk编码之后的编码值输出。

注意：a 不是unicode, 如果变为a=u''，则不需要以上步骤

因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。

decode的作用是将其他编码的字符串转换成unicode编码，

如str1.decode('gb2312')，表示将gb2312编码的字符串转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串，

如str2.encode('gb2312')，表示将unicode编码的字符串转换成gb2312编码。

还有一篇博客挺好：https://blog.csdn.net/weixin_42812527/article/details/81869740

来源：https://blog.csdn.net/pzqingchong/article/details/50953822

https://blog.csdn.net/ggggiqnypgjg/article/details/72783356

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python 'unicode_escape'

1.a=‘\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5317\u4eac\uff09\u6709\u9650\u516c\u53f8’>>> print unicode(a,'utf-8')\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。