字符编码总结

ASCII:0-127;
GB2312:0xA1A1-F7FE两个字节,是对ASCII的补充,同时也把ASCII中的字符编进 去,成全角字符。
GBK:是对GB2312的一种补充,收录的汉字范围更大。GB2312标准共收录6763个 汉字,其中一级汉字3755个,二级汉字3008个;GBK共收入21886个汉字和图形符号。
Unicode规定:全部字符都必须用两个以及两个以上字节来定义,也就是必须16位以及16位以上来统一所有的字符,对于ASCII里的127号以及以下的字符编码保持不变,只是将其长度从8位扩展至16位,高位补0。
UTF是个统称,它包括了UTF-8、UTF-16等传输标准。
unicode是一个字符集,它有自己的原生编码方式,就是每个字符用两个字节表示,utf-8是在实际应用中把unicode进行一定的编码,utf-8可以是1-4个字节。以第一个字节的高位1的个数来表示有几个字节组成字符,如果是0就是一个字节。如果两个程序进行通讯,一方是unicode,另一方是utf-8,就必须转换成统一的编码方式。
总结:UTF-8是unicode的一种实现方式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值