字符集、字符编码、字符序
字符集合
字符的集合
字符编码
ASCII字符编码
UTF-8编码 这是一种变长字节编码方式,一个英文字符一个字节,一个中文字符,3个字节
1字节字符编码 0xxxxxxx
2字节字符编码 110xxxxx 10xxxxxx
3字节字符编码 1110xxxx 10xxxxxx 10xxxxxx
4字节字符编码 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
以此类推,最多存在6字节编码的字符
GBK编码
Big5编码
Unicode编码
字符集
字符集合+编码=字符集
ASCLL 字符集 8位二进制128个字符(有一位没用到)
扩展ASCLL字符集 拉丁语系 8位二进制256个字符
GB2312 国标,汉语 16位
BIG5 繁体字 16位
GBK 16位 简体中文
Unicode 全球语言 16位
字符集包含关系
Unicode>GBK>扩展的ASCLL>ASCLL
字符序
collation,定义字符集中字符的排序规则
乱码的原因
存储和打开文本时使用了不同的字符集