python 字符串的编码与转义

最新推荐文章于 2023-09-13 22:02:54 发布

机智如我^O^

最新推荐文章于 2023-09-13 22:02:54 发布

阅读量458

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/mysql110_/article/details/98508260

版权

python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

encode 是编码,将字符串转换成字节码。str–>byte
decode 是解码 ,将字节码转换成字符串。 byte–>str
在这里插入图片描述

在计算机中所有的信息最终都表示为一个二进制的字符串，每一个二进制位有 0 和 1 两种状态，通过不同的排列组合，使用 0 和 1 就可以表示世界上所有的东西。在计算机种中，1 字节对应 8 位二进制数，而每位二进制数有 0、1 两种状态，因此 1 字节可以组合出 256 种状态。如果这 256 中状态每一个都对应一个符号，就能通过 1 字节的数据表示 256 个字符。美国人于是就制定了一套编码（其实就是个字典），描述英语中的字符和这 8 位二进制数的对应关系，这被称为 ASCII 码。 ASCII 码一共定义了 128 个字符，例如大写的字母 A 是 65（这是十进制数，对应二进制是 0100 0001）。这 128 个字符只使用了 8 位二进制数中的后面 7 位，最前面的一位统一规定为 0。
在这里插入图片描述

但是随着计算机的全球普及，128 个字符无法保存其他国家的字符。因此出现了
很多自己国家的编码，例如中国的 GB2312 编码,日本把日文编到 Shift_JIS 里，韩国把韩文编到 Euc-kr 里。这样就解决了各个国家保存字符的问题。但是，如果在中国使用 GB2312 编码写的内容，我们使用 U 盘拷一份去日本然后再使用日本的电脑打开，就会出现乱码。为了解决这个问题，出现了‘万国码’Unicode。 Unicode 规定了世界上所有的字符都对应一个唯一的编号，但是没有规定在电脑上怎么保存。例如’我’这个字符对应的编号是‘12345’，这个‘12345’这个编码具体怎么在电脑上保存(占两个字节还是占三个字节)Unicode 没有规定。 UTF-8 编码是对 Unicode 的具体实现，UTF-8 规定了字符在电脑上的保存形式。 UTF-8 最大特点就是可变长。它可以使用 1 - 4 个字节表示一个字符，根据字符的不同变换长度。英文还是占 1 个字节，中文占 3 个字节。注: UTF-8 编码实现了 ASCII 码的向后兼容，对于英文中的 0 - 127 号字符，与 ASCII 码完全相同。使用 ASCII 码编写的内容，使用 UTF-8 同样能打开。

转义字符

引入：向控制台打印 msg=’tom’s phone number is 110’这句话。
在这里插入图片描述

我们发现报错了，因为程序将’tom’看成了一个字符串而后面的字符串出现了语法错误。怎么解决这个问题呢？我们可以使用双引号或者使用转义字符来解决。使用双引号:
在这里插入图片描述

使用转义字符：
在这里插入图片描述

转义字符：顾名思义改变原有字符的意义。转义字符格式: \特定字符。
在这里插入图片描述

在这里插入图片描述

注意”\t”
在这里插入图片描述

机智如我^O^

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 字符串的编码与转义

encode 是编码,将字符串转换成字节码。str–>bytedecode 是解码 ,将字节码转换成字符串。 byte–>str在计算机中所有的信息最终都表示为一个二进制的字符串，每一个二进制位有 0 和 1 两种状态，通过不同的排列组合，使用 0 和 1 就可以表示世界上所有的东西。在计算机种中，1 字节对应 8 位二进制数，而每位二进制数有 0、1 两种状态，因此 1 ...
复制链接

扫一扫