Python学习笔记 - 解码和编码

最新推荐文章于 2024-06-20 17:54:56 发布

weixin_34175509

最新推荐文章于 2024-06-20 17:54:56 发布

阅读量66

点赞数

文章标签： python

原文链接：https://juejin.im/post/5c1b4d025188253b7e74a353

版权

我们需要一个字典让计算机能读懂我们的语言，这个字典就叫做 - 编码表

编码：人类语言 -> 编码表 -> 机器语言解码：机器语言 -> 编码表 -> 人类语言

因为最早的计算机由美国人发明，所以最开始只有英文的编码表 - ASCII，只支持：大写字母，小写字母，数字，和一些常用符号。

但是世界上有那么多语言，ASCII编码表不能满足其他语言的需求，于是就诞生了很多编码表，常见的有：

编码表	适用性	特点
ASCII	支持英文大小写，常用的符合，数字，不支持中文	占用空间小
GB1312，GBK	支持中文	GBK码是GB1312的升级版
Unicode	支持国际语言	占用空间大，适用性强。
UTF-8	支持国际语言	UTF-8 是 Unicode 的实现方式之一。也可以认为是Unicode的升级版，占用空间小。UTF-8码包含ASCII码

数据在计算机的内存中，使用的是Unicode码，这是统一标准。

Python3中使用input方法输入的内容也是用Unicode码进行编码。

在Python中编码和解码的方法是：

('你要编码的内容').encode('编码表名字')
('你要解码的内容').decode('编码表名字')
复制代码

例子：

print('你好'.encode('utf-8'))
print('你好'.encode('gbk'))
print('abc'.encode('ASCII'))
print(b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8'))
print(b'\xc4\xe3\xba\xc3'.decode('gbk'))
print(b'abc'.decode('ASCII'))
复制代码

结果：

编码结果最开始有一个b，它表示数据是bytes（字节）类型

ord

单个字符的十进制整数编码。
chr

用一个范围在 0～255 整数作参数，返回一个对应的字符。

例子：

转载于:https://juejin.im/post/5c1b4d025188253b7e74a353

weixin_34175509

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python学习笔记 - 解码和编码

我们需要一个字典让计算机能读懂我们的语言，这个字典就叫做 - 编码表编码：人类语言 -> 编码表 -> 机器语言解码：机器语言 -> 编码表 -> 人类语言因为最早的计算机由美国人发明，所以最开始只有英文的编码表 - ASCII，只支持：大写字母，小写字母，数字，和一些常用符号。但是世界上有那么多语言，ASCII编码表不能满足其他语言的需求，于是就诞生了很多编码表，...
复制链接

扫一扫