计算机中的编码
- 在很久很久以前,计算机还是8位的(现在的计算机多是64位的或者32位的).在那个时候编码字符就只能使用8位二进制数,因此就只能编码128个字符(这就是传说中的 ASCII码 )
- 然后随着计算机的发展,计算机的应用越来越广泛,这导致了一些问题.例如中国人编写的中文就是GBK系列编码,美国人可能有一套编码编码英语,但由于两个国家之间没有经过协商,就有可能造成编码冲突.举个例子:美国人可能将"hello,world"编码为"110",
但是中国人将’“掏粪"编码为"110”,然后一个中国人给一个美国人发送了一封邮件,美国人打开文件的时候是用他们的编码打开的,然后一个好好的hello,world 变成了掏粪,造成冲突.
通常在这个国家冲突的时候,总会有一个国际性组织制定规范来解决冲突,因此***Unicode编码***就被制定出来了.
Unicode编码
- 这个编码可谓是统一了全球,它将全世界所有能表示信息的符号都进行了统一了编码,自然这种情况下是不可能产生冲突的啦,因为每个字符都有他对应的编码.
utf-8编码
- utf-8编码是一种符合Unicode规范的编码,也可以说是在Unicode编码上的一种改进编码
- 相信这个大家都比较熟系了,它是现在的一种最常用的编码了,既然都已经有了*Unicode编码***,为什么还需要utf-8编码呢?因为,我只知道其中的一个原因Unicode太占内存了
详情读者自己查阅相关资料