编码总结

1、ASCII是0~127位编码,包含了英文字符和其他常见的符号

2、DBCS(双字节字符集):GB2312、GBK标准、GB18030

  • GBK2312:对ASCII的中文扩展,小于127的字符与ASCII相同,两个大于127的字符连接在一起表示汉字,第一个字节从0XA1~0XF7,第二个字节从0XA1~0XFE,只能表示常见的6000多个简体汉字
  • GBK标准:对GBK2313的扩展,只要第一个字节大于127就表示汉字,能表示汉字和繁体字
  • GBK18030:对GBK标准的扩展,可表示少数民族汉字

3、Unicode:字符集,用16位来表示所有字符,注意区分字符和字节区别(字符是文化表示,字节是物理存储单位)UTF-8、UTF-16是其编码实现

  • UTF-8:以8位为编码单位,是一种变长的编码方式,使用1~4个字节表示以一个字符
  • UTF-16:以16位为编码单位,是一种变长的编码方式,严格来讲UTF-16才是Unicode的编码实现
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值