Unicode字符集

最新推荐文章于 2021-10-13 14:53:44 发布

cugbtang

最新推荐文章于 2021-10-13 14:53:44 发布

阅读量242

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013616005/article/details/96858700

版权

python 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

Unicode 仅仅只是一个字符集，规定了符合对应的二进制代码，至于这个二进制代码如何存储则没有任何规定。它的想法很简单，就是为每个字符规定一个用来表示该字符的数字，仅此而已。

为了较好的解决 Unicode 的编码问题， UTF-8 和 UTF-16 两种当前比较流行的编码方式诞生了：

“汉”的 Unicode 码点是 0x6c49（110 1100 0100 1001），通过上面的对照表可以发现，0x0000 6c49 位于第三行的范围，那么得出其格式为 1110xxxx 10xxxxxx 10xxxxxx。接着，从“汉”的二进制数最后一位开始，从后向前依次填充对应格式中的 x，多出的 x 用 0 补上。这样，就得到了“汉”的 UTF-8 编码为 11100110 10110001 10001001，转换成十六进制就是 0xE6 0xB7 0x89。
解码的过程也十分简单：如果一个字节的第一位是 0 ，则说明这个字节对应一个字符；如果一个字节的第一位1，那么连续有多少个 1，就表示该字符占用多少个字节。

python 2.x默认的字符编码是ASCII，默认的文件编码也是ASCII。

python 3.x默认的字符编码是unicode，默认的文件编码是utf-8。

https://www.cnblogs.com/zhangqigao/p/6496172.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

cugbtang CSDN认证博客专家 CSDN认证企业博客

码龄11年

128: 原创

5万+: 周排名

162万+: 总排名

9万+: 访问

: 等级

1965: 积分

60: 粉丝

78: 获赞

18: 评论

328: 收藏

私信

关注

热门文章

分类专栏

kubernetes 20篇
common 10篇
云原生 1篇
manage 8篇
monitor 14篇
books 10篇
middle 4篇
python 10篇
linux 12篇
go 17篇
arithmetic 16篇

最新评论

ETCD看这一篇就够了
—丫丫: 你好，请问你的这个问题解决了嘛
ETCD看这一篇就够了
回首笑人间: 博主您好，我现在遇到了一个您文章中说到的问题，我的etcd里报错：error "remote error: tls: bad certificate", ServerName "" 请问您是如何添加域名的呢？如果可以回复一下，不胜感谢
ETCD看这一篇就够了
qq_172184221: 我现在报如下错误，您能帮我看下怎么解决么？十分感谢 Active: activating (start) since Mon 2022-11-07 04:23:08 EST; 1min 29s ago node1 etcd[1319]: {"level":"warn","ts":"2022-11-07T04:24:33.886-0500","caller":"rafthttp/probing_status.go:68","msg":"prober detected unhealthy status","round-tripper-name":"ROUND_TRIPPER_SNAPSHOT","remote-peer-id":"64742c95968f714a","rtt":"0s","error":"remote error: tls: bad certificate"}
项目经验嘿嘿嘿
gzsdgzsdfg: 支持一下很赞
CKA看这一篇就够了
flichote: 很全很好呀，谢谢啦！！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。