UTF-8(8-bit Unicode Transformation Format)。它是一种针对Unicode的可变长度字符编码,它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,而当字符在ASCII码的范围时,就用一个字节表示,所以UTF-8还可以兼容ASCII编码
Unicode是内存编码的规范,而UTF-8是如何保存和传输Unicode的手段。
print('吴峰'.encode('utf-8')) #输出b'\xe5\x90\xb4\xe5\xb3\xb0'
print('吴峰'.encode('gbk')) #输出b'\xce\xe2\xb7\xe5'
print(b'\xe5\x90\xb4\xe6\x9e\xab'.decode('utf-8')) #输出吴枫
print(b'\xce\xe2\xb7\xe3'.decode('gbk')) #输出吴枫
#其中b'表示输出为字节byte类型的数据
编码:encode
解码:decode
\xe5\x90\xb4\xe6\x9e\xab # Py