\x与\u编码的区别,并使用python对其进行转换

首先前面的 \表示转义,
  • \x:只是 16 进制的意思,后边跟两位,则表示单字节编码;
    • \d:十进制;\o:八进制;
    • 对于 \xaa ⇒ chr(0xaa) ⇒ chr(16*a+a)
>> str1='\xE4\xB8\x89\xE7\xBA\xA7\xE8\x8A\x82\xE7\x82\xB9'
>> print unicode(str1,'utf-8')
  • \u:unicode 码;
    • 一般其后跟 4 个 16 进制数,因此,一般为 unicode-16
    • Python:字符串的decodeencode成员函数,可对其进行转换
>> str2 = '\u4f60\u597d'
>> print str2.decode('unicode_escape')
# 一定要使用 print

展开阅读全文

没有更多推荐了,返回首页