前言
想必大家都知道计算机所识别的语言是二进制语言,也就是0和1的代码,任何字符最终都要被计算机所转换为0和1组成的代码。而在我们计算机领域呢,涉及到许许多多除二进制编码以外的编码。如ASCII码,Unicode,UTF-8,URLcode等。今天我们就来详细的学习一下这四种编码,也是我们平时接触最多的。
ASCII码
起初,计算机是由美国人发明出来的,所以老美们为了将自己的语言也就是英语转换成计算机所识别二进制语言,于是乎呢,就自己编写一套编码,也就是ASCII码。
在计算机种中,1 字节对应 8 位二进制数,而每位二进制数有 0、1 两种状态,因此 1 字节可以组合出 256 种状态。用这256种8位0和1的组合方式来表示英语中所包含的字符是足够的。状态这 256 中状态每一个都对应一个符号,就能通过 1 字节的数据表示 256 个字符。描述英语中的字符和这 8 位二进制数的对应关系,这被称为 ASCII 码。
ASCII 码一共定义了 128 个字符,这 128 个字符只使用了 8 位二进制数中的后面 7 位,最前面的一位统一规定为 0。
下面是ASCII码表: