- 支持中文的编码历史
- python版本的编码类型
1.支持中文的编码历史
支持中文的第一张表:GB231.
年份 | 名称 | 包含汉字数目 |
---|---|---|
1980 | gb2312 | 6763 |
1995 | gbk1.0 | 20000 |
2000 | gb18030 | 27000 |
Unicode 万国码 支持所有国家和地区的编码。
2**16 = 65535 = 存一个字符,统一占用2个字节。
UTF-8 = Unicode的扩展集,可变长的字符编码集
Assic -->b=gb2312 -->gbk1.0 -->gb18030
Assic -->Unicode -->UTF-8
2.python版本的编码类型
Python2.x == Assic默认编码
Python3.x == Unicode 默认编码
Unicode 是向下兼容gb2312、gbk。