俄文unicode完整编码表_数据编码(一)搞懂ASCII、Unicode和UTF-8之间的区别和联系...

本文探讨了字符编码的历史,从ASCII到Unicode,再到广泛使用的UTF-8编码。ASCII最初用于表示128个字符,而Unicode作为万国码统一了全球字符的编码。UTF-8作为Unicode的一种实现,是一种可变长度的编码方式,高效且广泛应用。文中还介绍了UTF-8的编码规则,并通过举例解释了如何将Unicode转换为UTF-8编码。
摘要由CSDN通过智能技术生成

fac8b9eedf79ec19482c96a4bc4b5808.png

一直觉得字符的编码很玄幻,总是想弄懂,但是一直没有话时间去琢磨,有点 。所以趁着这段时间空闲,补充补充鸡汤。幸运的是,在谷歌上看到阮一峰大佬的博客,讲的就是关于 UnicodeUTF-8以及ASCII之间的关系,看的我是醍醐灌顶,不愧是大佬,讲的那叫一个透彻~

1、前世ASCII

首先我们的字母都是由8位一个字节的二进制数进行表示的,这样就可以表示256个字符,从 0000000011111111

后来美国规定了 ASCII 的范围,总共128个字符,占据了后7位,第一位默认就是0。

再到后来,又扩充到256个字符,其实也就是第8位也算进去。但是这里需要注意的是,多的128个符号编码,并不属于 ASCII 码,只能说是扩展的。

之后随着各国语言的增多,就会遇到编码不够的问题,像咱国家的汉字就有很多。所以为了适应这样的需求,Unicode 俗称万国码,就这样诞生了,所有的文字以及字符都对应一个特定 Unicode 编码,实现了编码“大一统”。

2、今生Unicode

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值