unicode编码_ASCII编码, Unicode编码,UTF-8编码

最新推荐文章于 2024-04-28 18:38:41 发布

weixin_39907922

最新推荐文章于 2024-04-28 18:38:41 发布

阅读量786

点赞数

文章标签： unicode编码

1. ASCII编码：

ASCII编码是1个字节，Unicode编码通常是2个字节。
字母A用ASCII编码是十进制的65，二进制的01000001；

2. Unicode编码

因ASCII编码1个字节不够编码全部字符，所以用Unicode编码补救。

eg：如果把ASCII编码转换成=》Unicode编码，只需在前面补0。因此，A的Unicode编码是0000000001000001。

统一成Unicode编码，乱码问题消失了。但是用Unicode编码比ASCII编码需要多一倍的存储空间，会在存储和传输上造成浪费。

3. UTF-8编码

本着节约的精神：=>把Unicode编码转化为“可变长编码”的UTF-8编码。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，生僻的字符继续编码成4-6个字节。

用UTF-8编码节省空间：

UTF-8编码额外的好处：部分ASCII编码 = UTF-8编码。

4. 应用举例

Python3 内存中使用的字符串是 Unicode编码，但是网络传输的数据是 UTF-8 编码。

从网络中读取数据： UTF-8 编码的数据--->decode---> Unicode编码；

反之，存储数据：Unicode编码-->encode--> UTF-8 编码

weixin_39907922

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
unicode编码_ASCII编码, Unicode编码,UTF-8编码

1. ASCII编码：ASCII编码是1个字节，Unicode编码通常是2个字节。字母A用ASCII编码是十进制的65，二进制的01000001；2. Unicode编码因ASCII编码1个字节不够编码全部字符，所以用Unicode编码补救。eg：如果把ASCII编码转换成=》Unicode编码，只需在前面补0。因此，A的Unicode编码是0000000001000001。统一成Unicode编...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。