计算机基础 常用字符编码标准
ASCII:
American Standard Code for Information Interchanged,译为美国信息交换标准码。计算机专业同学最为熟悉的编码集。一个ASCII编码的数据占8位二进制数,但其中第一位为0,其他七位为有效位。7位二进制一共0x00~0x7F总共128种组合,分别表示了如下图所示的含义。ASCII比较适用于使用英文的国家,例如美、英等国。
(图片来源于网络)
ANSI:
ANSI相当于ASCII的哥哥,ASCII仅仅有0~127这128种组合,但ANSI在后面扩充了8个二进制位,也就是总共16位二进制(两个字节)。ANSI的前128个数(0x0000-0x007F)依然和ASCII一样,但128往后(0x0080-0xFFFF)的数则用来表示其他的意义,基本上由各国自己定义编码。
Unicode:
又叫万国码,由两个字节组成,它将各种语言字符的二进制编码进行统一,目的就是为了让不同语言在不同设备之间能够进行跨平台应用。
UTF-8:
UTF-8是Unicode的升级版,Unicode是两个字节表示一个字符,这样假设我们的文本都是英文,那直接使用ASCII岂不是更节省空间。因此,为了节省空间,提高效率,提出了UTF-8这样的可变长编码标准。UTF-8是兼容ASCII的,什么意思呢,就是UTF-8的第一个字节是包含了ASCII的,假设你在一台支持UTF-8的设备上使用ASCII编码的文本应该也是可行的。
来自:九七的计算机基础(转载请注明出处)