- 字符集(character set)
字符的集合。字符集种类较多,每个字符集包含的字符个数不同。
常见字符集:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集。 - 字符编码(character encoding)
把字符集中的字符,编码为指定集合中的某一对象,以便文本在计算机中存储和通过通信网络进行传递。
Unicode字符集:可以编码为UTF-8、UTF-16、UTF-32。
GB2312字符集:可以编码为ISO/IEC2022、EUC。
BIG-5字符集:不需要编码。 - chcp
change code page 活动代码页
936:gbk
65001:utf-8 - utf-8签名
当有签名的UTF-8编码内容被解析器解析时,解析器直接根据签名即可判断出使用UTF-8编码来进行解析,当无签名时,解析器会根据内容的编码来进行判别。
有签名也就是带 BOM 信息。BOM,即 Byte Order Mark,也即字节流标记,它是用来让应用程序识别所用的编码的。UTF-8 的 BOM 是 0xEFBBBF。
字符集 字符编码 utf-8签名 chcp
最新推荐文章于 2023-05-18 13:08:59 发布