Python 'unicode_escape'

1.

a=‘\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5317\u4eac\uff09\u6709\u9650\u516c\u53f8’
>>> print unicode(a,'utf-8')
\u767e\u5ea6\u5728\u7ebf\u7f51\u7edc\u6280\u672f\uff08\u5317\u4eac\uff09\u6709\u9650\u516c\u53f8
>>> print(a.decode('unicode_escape'))

百度在线网络技术(北京)有限公司

  “反编码”我自己起的名字,大概意思就是我得到一串字符,是unicode码,如:‘\u53eb\u6211’,进行反编码后得到其对应的汉字。

2.

print u"中".encode("unicode-escape")

\u4e2d

这里是将“中”的unicode编码值(4E2D)输出。

3.

string-escape是对二进制的字节流,一个字节一个字节转义,并对每个字节以16进制输出,比如:

In [22]: print "中".encode("string-escape")

\xe4\xb8\xad  #注意,这是一个字符串'\\xe4\\xb8\\xad'

这里是将"中"的utf-8编码值(E4B8AD)输出成一个可见字符串。

In [72]: "中".encode("string-escape")

Out[72]: '\\xe4\\xb8\\xad'

In [64]: u"中".encode("gbk").encode("string-escape")

Out[64]: '\\xd6\\xd0'

这里是将“中”以gbk编码之后的编码值输出。

注意 :a 不是unicode,  如果变为a=u'',则不需要以上步骤

因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 

decode的作用是将其他编码的字符串转换成unicode编码, 

如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码。 

encode的作用是将unicode编码转换成其他编码的字符串, 

如str2.encode('gb2312'),表示将unicode编码的字符串转换成gb2312编码。

 

还有一篇博客挺好:https://blog.csdn.net/weixin_42812527/article/details/81869740

 

 

 

 

来源:https://blog.csdn.net/pzqingchong/article/details/50953822

https://blog.csdn.net/ggggiqnypgjg/article/details/72783356

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值