中文与\u xxxx互转码
# 中文转\u xxxx
name = '吴京'
name1 = name.encode('unicode_escape')
# b'\\u5434\\u4eac'
# \u xxxx转中文
name2 = name1.decode('unicode_escape')
中文与 \x xx互转码
# 中文转 \x xx
name3 = name.encode('utf-8')
# b'\xe5\x90\xb4\xe4\xba\xac'
# \x xx转中文
name4 = name3.decode('utf-8')
中文与base64的互转码
# 中文转base64
import base64
name3 = name.encode('utf-8')
name5 = base64.b64encode(name3)
# b'5ZC05Lqs'
# base64转中文
name6 = base64.b64decode(name5)
# name6 == name3
name7 = name6.decode('utf-8')
总结
- 中文<–> \u xxxx
encode(‘unicode_escape’) <–> decode(‘unicode_escape’) - 中文 <–> \x xx
encode(‘utf-8’) <–> decode(‘utf-8’) - 中文 <–>base64
encode(‘utf-8’) --> base64.b64encode()
base64.b64decode() --> decode(‘utf-8’)
总之,中文转其他编码,就用encode()进行编码,其他编码转中文就用decode()进行解码.