首先前面的
\
表示转义,
- \x:只是 16 进制的意思,后边跟两位,则表示单字节编码;
-
- \d:十进制;\o:八进制;
- 对于 \xaa ⇒ chr(0xaa) ⇒ chr(16*a+a)
>> str1='\xE4\xB8\x89\xE7\xBA\xA7\xE8\x8A\x82\xE7\x82\xB9'
>> print unicode(str1,'utf-8')
|
- \u:unicode 码;
-
- 一般其后跟 4 个 16 进制数,因此,一般为 unicode-16
- Python:字符串的decode和encode成员函数,可对其进行转换
>> str2 =
'\u4f60\u597d'
>>
print
str2.decode(
'unicode_escape'
)
# 一定要使用
print
|