字符编码
1.二进制 —> ASCII :只能存英文和拉丁字符。一个字符(a)占一个字节。一个汉字占8个字节
gb2312:只能6700多个中文,1980
gbk1.0:存了两万多个字符,1995
gb18030:2000,27000中文
unicode
,万国码:
utf-32,一个字符占4个字节
utf-16,一个字符占2个字节或2个以上,65535
utf-8:一个英文用ASCII码来存,一个中文占三个字节
in python2
默认是ASCII
in python3
默认 是 unicode
出错:
u\bfh\hvf\dff u就是unicode
b = byte = 字节类型 = [0-255]
encode
在编码的同时,会把数据转成bytes
类型
bytes
已经是gbk格式