文章目录
字符集简介
字符是各种文字和符号的总称,而字符集是多个字符的集合。
字符集分类与特点
字符包含有国家文字、标点符号、图形符号、数字等内容,字符集是多个字符的集合,字符集种类非常多,每种字符集包含的字符个数是不相同的。比如说,国家文字不同,就会使用各自国家通用字符集,这样是不是好理解一些。
常见字符集分类
- ASCII(American Standard Code for Information Interchange,美国信息互换标准编码):是基于罗马字母表的一套电脑编码系统,一个字节表示一个字符。
- LATIN1:ASCII 字符集的扩充,仍然使用一个字节表示一个字符。
- GB2312(信息交换用汉字编码字符集·基本集):中国国家标准的简体中文字符集,基本满足了汉字的计算机处理需要,分区表示,双字节表示一个字符。
- GB18030(信息交换用汉字编码字符集基本集的扩充):是 GB2312 的扩充,更全面,兼容 Unicode 3.0 和 GB2312。
- UTF-8(Unicode Tranformation Format):是 Unicode 的其中一个使用方式,支持所有国家字符集,使用 1-4 个字节表示一个字符。
字符集有很多,这里不一一列举。想要获取全部支持字符集,可以在库中查看,详见下文。
字符集特点
- 不同的编码