ASCII编码和Unicode编码的区别

最新推荐文章于 2020-06-06 11:27:30 发布

岱宗雪

最新推荐文章于 2020-06-06 11:27:30 发布

阅读量5.5k

点赞数 2

分类专栏： Python

Python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文摘录自廖雪峰的python教程如有侵权，请联系删除。

ASCII编码是1个字节，而Unicode编码通常是2个字节。
字母A用ASCII编码是十进制的65，二进制的01000001；

字符0用ASCII编码是十进制的48，二进制的00110000，注意字符’0’和整数0是不同的；

汉字中已经超出了ASCII编码的范围，用Unicode编码是十进制的20013，二进制的01001110 00101101。

你可以猜测，如果把ASCII编码的A用Unicode编码，只需要在前面补0就可以，因此，A的Unicode编码是00000000 01000001。

新的问题又出现了：如果统一成Unicode编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

搞清楚了ASCII、Unicode和UTF-8的关系，我们就可以总结一下现在计算机系统通用的字符编码工作方式：

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
ASCII编码和Unicode编码的区别

本文摘录自廖雪峰的python教程如有侵权，请联系删除。ASCII编码是1个字节，而Unicode编码通常是2个字节。字母A用ASCII编码是十进制的65，二进制的01000001；字符0用ASCII编码是十进制的48，二进制的00110000，注意字符’0’和整数0是不同的；汉字中已经超出了ASCII编码的范围，用Unicode编码是十进制的20013，二进制的01001110 001...
复制链接

扫一扫

专栏目录

岱宗雪 CSDN认证博客专家 CSDN认证企业博客

码龄13年

25: 原创

25万+: 周排名

38万+: 总排名

10万+: 访问

: 等级

1133: 积分

28: 粉丝

35: 获赞

15: 评论

163: 收藏

私信

关注

热门文章

分类专栏

最新评论

tf.name_scope与tf.variable_scope用法区别
若初雪舞: 写的太好了，值得反复看，我最近开始涉足这一块，您这篇博客写的特别好，看了好几次，谢谢啦
利用python往oracle写数据
污污的小吴吴: 批量处理的错误是出在日期格式没转换的问题，data里面的数值都是字符串，还什么迷之神奇，碰到问题可以DEBUG一下就会发现问题了,改为以下代码即可： [code=python] sql = '''insert into bigdatateam.mx (mxbm,mxmc,mxsm,updatetime) values (:1,:2,to_timestamp(:3,'yyyy-mm-dd hh24:mi:ss:ff'),:4) ''' [/code]
tf.name_scope与tf.variable_scope用法区别
TBSOliver: 优质文章，一键三联！
tf.add_to_collection、tf.get_collection、tf.add_n用法浅析
qq_41072311: 多谢！
FP-Growth算法理解
方言Mcx: 好

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。