我们都知道编码过程中使用的字符串都是通过二进制形式存放在计算机中的;那么这个形式就是指的“编码格式”!
- 最早出现的计算机起源于美国,因此美国依据自身的大约127个字符创造编码格式,后来因为扩充了各种字符,因此创造出了Ascii 256;
- 逐渐的中国开始创建属于自己的编码格式,那就是GB2312,中国大陆的汉字编码,占用内存比国际标准要小,大概有6000个汉字;
- 但是香港和台湾使用繁体字,所以衍生出GBK这个编码格式;
- 逐步扩充,包括少数民族语言,也就是GB18030编码格式。
- 但是为了解决每个国家都有自己的一套编码标准,国际上不统一的问题,因此出现了一个组织“ISO”,然后制定了相应的标准Unicode码,
- 最初使用的是utf-16采用定长的方式存储二进制,无论什么字符都采用两个字节进行存储;
- 为了减少开销,因此我们现在统一使用的都是变长的方式存储二进制Utf-8;直到现在我们还一直使用这种编码格式;