ASCII和Unicode的区别

qq_37700361

于 2019-03-07 13:52:39 发布

阅读量382

点赞数

分类专栏：学习笔记

本文链接：https://blog.csdn.net/qq_37700361/article/details/88299792

版权

学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

ASCII：
采用单字节编码，适用于所有拉丁文字字母
使用7 位二进制数（剩下的1位二进制为0）来表示所有的大写和小写字母，数字0 到9、标点符号，以及在美式英语中使用的特殊控制字符。其最高位(b7)用作奇偶校验位。在代码传送过程中用来检验是否出现错误的一种方法，一般分奇校验和偶校验两种。奇校验规定：正确的代码一个字节中1的个数必须是奇数，若非奇数，则在最高位b7添1；偶校验规定：正确的代码一个字节中1的个数必须是偶数，若非偶数，则在最高位b7添1。
c使用的就是ASCII编码。

unicode：
为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。
通常用两个字节表示一个字符，原有的英文编码从单字节变成双字节，只需要把高字节全部填为0就可以。

UFT-8：一种变长的编码方案，使用 1~6 个字节来存储；
UFT-32：一种固定长度的编码方案，不管字符编号大小，始终使用 4 个字节来存储；
UTF-16：介于 UTF-8 和 UTF-32 之间，使用 2 个或者 4 个字节来存储，长度既固定又可变。

只有 UTF-8 兼容 ASCII，UTF-32 和 UTF-16 都不兼容 ASCII，因为它们没有单字节编码。
如果使用UTF-8，数字，英文字母，标点符号各占1个字节汉字，标点符号各站2个字节。
Java使用的是固定长度的UTF-16编码

qq_37700361

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ASCII和Unicode的区别

ASCII：采用单字节编码，适用于所有拉丁文字字母使用7 位二进制数（剩下的1位二进制为0）来表示所有的大写和小写字母，数字0 到9、标点符号，以及在美式英语中使用的特殊控制字符。其最高位(b7)用作奇偶校验位。在代码传送过程中用来检验是否出现错误的一种方法，一般分奇校验和偶校验两种。奇校验规定：正确的代码一个字节中1的个数必须是奇数，若非奇数，则在最高位b7添1；偶校验规定：正确的代码一个...
复制链接

扫一扫