编码方式:
ascii: 英文 :8位 一个字节
unicode: 英文:32位 四个字节
中文:32位 四个字节
utf-8: 英文:8位 一个字节
中文:24位 三个字节
gbk: 英文:8位 一个字节
中文:16位 两个字节(包含大多数汉字)
注意:1:各个编码之间的二进制,是不能互相识别的,会产生乱码
2:文件的储存,传世,不能是unicode(只能是utf-8,utf-16,gbk,gb2312,ascii等)
str在内存中使用unicode编码
英文: str :表现形式:s = 'zzz'
编码方式: 010101010(假设) unicode
bytes:表现形式:s = b'zzz'
编码方式: 000101010 utf-8 gbk。。。
中文: str :表现形式:s = '中国'
编码方式: 010101010 unicode
bytes:表现形式:s = b'\e91\e91\e01\e21\e31\e32'
编码方式: 000101010 utf-8 gbk。。。
encode解码:str-->bytes
s = 'zzz'
s1 = s.encode('utf-8')