Unicode发展历史

Unicode发展历史
1.iso8859编码(字母转化成ascall码)
起初的“iso8859“编码方式,只是编码了英语字母,将每一个字母对应一个数字(将字母编码后得到的数字则称为ascall码)。A->Z(65->90),a->z(97->122).这种编码方式只用1个字节存储编码。
使用iso8859编码方式将”ABCabc”编码,代码展示如下:
在这里插入图片描述
在这里插入图片描述

代码运行结果:
在这里插入图片描述
2.gb2312编码方式
Gb2312编码方式是在iso8859编码方式的基础上,增加了对汉字的编码。并且,增加了一个字节存储汉字的编码(即使用两个字节)。这里为了区别字母和汉字的编码,将汉字得到的编码的每一个字节最高位设置为1,所以汉字编码后每一个字节都为负数。
使用gb2312编码方式将“ABC通信原理”编码,代码展示如下:
在这里插入图片描述
在这里插入图片描述

代码运行结果:
在这里插入图片描述

可以看到,“ABC”得到的编码(ascll码)为正值,”通信原理”得到的编码为负值。

3.gbk编码方式
由于汉字太多了,并且在不断增加。人们在使用过程中发现之前的gb2312编码方式很多汉字都无法适用。所以,增加了gbk编码。
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。
使用gbk编码方式将“ABC通信原理”编码,代码展示如下:
在这里插入图片描述
在这里插入图片描述

代码运行结果如下:
在这里插入图片描述

可以看到,使用gbk与使用gb2312对”ABC通信原理”进行编码后得到的结果完全一致。因为gbk完全继承了gb2312,只是收录了更多的汉字。
使用gb2312对“ABC通信原理”进行编码得到的结果如下:

在这里插入图片描述

3.unicode编码
除了字母和汉字,世界上所有的国家的语言同样需要编码。所以出现了unicode编码,Unicode编码是适合所有国家文字的一种编码方式,比如朝鲜语、韩文、日文、乌克兰语等。。
使用代码对中文版、韩文版、日文版、俄文版的“通信原理“进行unicode编码代码展示如下。
(”通信原理”、”의사 소통의 원칙”、“通信の原理”、” Принципы коммуникации“)

在这里插入图片描述
在这里插入图片描述

运行结果如下:
在这里插入图片描述

可以看到,同样都是“通信原理“,不同的语言经过unicode编码后得到的编码是不一样的。所以,实际上在unicode编码中,每一个国家的文字都有唯一对应的编码。

4.utf-8编码(万国码)
Utf-8编码是一种针对 Unicode 的可变长度字符编码,又称 为“万国码“,是 Unicode 的实现方式之一。编码中的第一个字节仍与 ASCII 兼容,这使得原来处理 ASCII 字符的软件无须或只需做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持 UTF-8 编码。
utf-8是我们现在通信主要采用的Unicode编码方式,其“可变长“、”兼容iso8859“的特性使得它极其全面和方便。
使用代码对中文版、韩文版、日文版、俄文版的“通信原理“进行utf-8编码代码展示如下。
(”通信原理”、”의사 소통의 원칙”、“通信の原理”、” Принципы коммуникации“)
在这里插入图片描述
在这里插入图片描述

运行结果如下:
在这里插入图片描述

Utf-8编码方式编码和普通的unicode编码方式编码得到的结果还是不一致的,其明显区别在于“编码更长”.
使用普通unicode编码的到的结果如下:

在这里插入图片描述

总结
以上,是unicode编码的发展历史。通过对编码方式的学习我们可以了解到,在计算机中所有的字符的识别都需要参照一个映射表,计算机实际上只能识别这些二进制编码,通过这张参照表再映射人们所能看到的文字。编码方式的发展,实际上是这映射表的完善历史。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吴澳

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值