学习中,有错误的地方,欢迎指出
1. ASCII编码
- 美国标准信息交换码
- 只用一个字节的7位来表示字符,只有128个字符
-
- 0-31、127:是控制字符或通信专用字符
- 48-57:是0到9的十个阿拉伯数字
- 65-90:是26个大写英文字母
- 97-122:是26个小写英文字母
- 其余的是特殊字符
2. ISO-8859-1编码
- 拉丁码表、欧洲码表
- 用一个字节的8位来表示字符
3. GB-2312编码
- 兼容了ASCII编码
- 中文编码表
- 使用1-2个字节来编码字符
- 使用字节的首位来区分字符所占的字节数
4. GBK编码
- 兼容了ASCII编码
- 中国的中文编码表的升级,融合了更多的中文文字字符
- 使用1-2个字节来编码字符
- 使用字节的首位来区分字符所占的字节数
5. Unicode编码
- 兼容了ASCII编码
- 国际标准码
- 融合了目前人类使用的所有字符,为每一个字符都分配唯一的字符码
- 所有的字符都有两个字节来表示,这里可以看出世界上所有的字符加起来不超过 2 ^ 16 个
6. UTF-8编码
- UTF字符标准是面向传输的标准,顾名思义,UTF-8是每次只传输8位,而UTF-16每次只传输16位
- 兼容了ASCII
- 其中中文是3个字节
- 可用1-4个字节来表示一个字符
- 有自己独特的方式去区分字符所占的字节数
举例
7. ANSI编码
- 通常指操作系统的默认编码
- 英文操作系统中是:ISO-8859-1
- 中文操作系统中是:GBK