从ASCII码到UTF-8

ASCII码是早期的计算机编码系统,主要用于英语字符。随着全球化和技术发展,其局限性逐渐显现,尤其是对非英语字符的支持。UTF-8编码格式由汤普逊和罗布-派克开发,它兼容ASCII并能表示Unicode标准中的所有字符,成为当今广泛使用的字符编码格式,具有变长编码和自我同步的特点。
摘要由CSDN通过智能技术生成

ASCII码(American Standard Code for Information Inerchange),是基于拉丁字母用于显示现代英语和其他西欧语言的计算机编码系统。
计算机这个学科是从美国发展起来的,20世纪二战之後,美国超越法国、德国成为全球科技中心,美国的通用语言是英语,而代表当时最发达生产力的西方世界对计算机使用英语是没有抵触的,因此信息交换标准代码采用美国英语字符发表时在1967年,解决在电子计算机中数据在存储和运算时使用二进制数表示的符号编码一致性,避免相互通信之间造成的信息混乱。
标准ASCII码(也称基础ASCII码)使用一个字节中的7位元,表示美式英语中使用的特殊控制符、标点符号、大写字母、数字和小写字母,最高位元常用作奇偶效验,是在代码传送过程中检验是否出现错误的一种方法。1986年ASCII规范最後一次更新,定义所有的128个字符(即ANSI字符集,ISO 8859-1-1987),新规范使用全部8位元,当最高位元为1时可增加128个字符,这些字符成为Extended ASCII,扩展ASCII码允许将附加的128个字符用于特殊字符、外来语字符和图形符号,譬如法语中字母上方的注音符号,欧洲国家使用256个的字符扩展ASCII码作为编码体系指定各自的标准,但基本ASCII码的规范保持一致。
20世纪80年代亚洲国家引进西方计算机技术,由于东亚、西亚地区的文字符号远远超过256个字符,ASCII码的字符数量局限性被暴露出来,各国首先通过增加字节数量来满足字符数量上的要求,用两个字节表示一个符号,字节最高元置1区别于标准ASCII码,然後跟随第二个字节,因此理论上可表示128*256=32768个字符,其中有中国大陆的GB2312简化汉字码ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值