字符集简介
字符集顾名思义就是多个字符的集合,这些字符包括包括:各国家文字、标点符号、图形符号、数字等。常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、
GB18030字符集、Unicode字符集等。
ASCLL 字符集
//ASCLL字符集共包含255个字符,它也是我们编程最先接触的字符集
UTF字符集
有ISO组织制定出的标准字符集,有UTF-8,UTF-16,UTF-32三套字符集组成。UTF是一个大的标准,它包括了全世界所有的字符。之所以 分为三部分,是因为如果每个字符都用32bit表示会空间造成浪费。
UTF的0~255和ASCLL是重叠的
- UTF-8
//表示字符的最小单位就是8bit 可变长, 最少8bit, 多了可以再占用
//多用于网络传输,因为它可以进行字符压缩,表示的字符编码超过8位占多少就是多少(可变长),不超过8位就用8位表示。
- UTF-16
//表示字符的最小单位就是16bit 可变长, 最少16bit, 多了可以在占用
//Windows从VISTA开始开始使用UTF-16。
//用wchar_t用来装UTF-16最好。
- UTF-32
//表示字符的最小单位就是32bit 可变长, 最少32bit, 多了可以在占用