字符编码的发展历程（ASCII、Unicode、UTF-8的由来及区别）

最新推荐文章于 2021-06-22 16:51:55 发布

zeng_ll

最新推荐文章于 2021-06-22 16:51:55 发布

阅读量2.2k

点赞数 3

分类专栏： JAVA 文章标签：字符编码 ASCII编码 Unicode编码 UTF-8编码字符编码发展历程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zeng_ll/article/details/88714847

版权

本文详细介绍了字符编码的发展历程，从ASCII编码的起源，到Unicode编码的诞生，再到UTF-8编码的广泛应用。Unicode解决了多语言文本的乱码问题，而UTF-8则在节省存储空间的同时兼容ASCII编码。在计算机系统中，内存通常使用Unicode，存储和传输时转换为UTF-8。

摘要由CSDN通过智能技术生成

1、字符编码的出现

我们都知道，计算机只能处理数字，即0和1，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数就是255（二进制11111111=十进制255），如果要表示更大的整数，就必须用更多的字节。比如两个字节可以表示的最大整数是65535，4个字节可以表示的最大整数是4294967295。

2、ASCII的由来

由于计算机是美国人发明的，所以只出现大小写英文字母、数字和一些符号。因此，最早只有127个字符被编码到计算机里，也就是7位2进制数字，最高位（第八位）为0。这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母z的编码是122。

3、Unicode的由来

上面提到的ASCII编码，由它来处理中文显然是一个字节不够的。至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。

可以想得到的是，全世界有上百种语言，日本把日文编到Shift_JIS里，韩国把韩文编到Euc-kr里，各国有各国的标准，就会不可避免地出现冲突，结果就是，在多语言混合的文本中，显示出来会有乱码。

因此，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。