文章大多摘自各种编码详解
一、常见编码发展过程
ASCII => GB2312 => GBK => ISO-8859-1(UNICODE) => UTF-8(UNICODE)
编码 | 表示方式
---|---
ASCII | 单字节(0-127)
扩展字符集 | 单字节(127-255)
GB2312 | 双字节(127+, 127+)
GBK | 双字节(127+, 0+)
ISO-8859-1 | 双字节重编
UTF-8 | 可变字节重编
原文链接:《旻天:计算机编码的发展史》https://zhuanlan.zhihu.com/p/158976603
二、常见编码详解
很久很久以前,有一群人,他们研究出了可以开合的晶体管,这个晶体管可以表示出高电位和低点位这两种点位,也就是0和1,他们把这个称作位(bit)。
之后他们又决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为"字节"(byte)。
再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去。他们看到这样是好的,于是它们就这机器称为"计算机"。
2.1 ASCII
开始,计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。
他们把其中的编号从0开