字符集 字符编码 utf-8签名 chcp

  • 字符集(character set)
     字符的集合。字符集种类较多,每个字符集包含的字符个数不同。
     常见字符集:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集。
  • 字符编码(character encoding)
     把字符集中的字符,编码为指定集合中的某一对象,以便文本在计算机中存储和通过通信网络进行传递。
     Unicode字符集:可以编码为UTF-8、UTF-16、UTF-32。
     GB2312字符集:可以编码为ISO/IEC2022、EUC。
     BIG-5字符集:不需要编码。
  • chcp
     change code page 活动代码页
     936:gbk
     65001:utf-8
  • utf-8签名
     当有签名的UTF-8编码内容被解析器解析时,解析器直接根据签名即可判断出使用UTF-8编码来进行解析,当无签名时,解析器会根据内容的编码来进行判别。
     有签名也就是带 BOM 信息。BOM,即 Byte Order Mark,也即字节流标记,它是用来让应用程序识别所用的编码的。UTF-8 的 BOM 是 0xEFBBBF。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值