python 字符串的编码与转义

encode 是编码,将字符串转换成字节码。str–>byte
decode 是解码 ,将字节码转换成字符串。 byte–>str
在这里插入图片描述

在计算机中所有的信息最终都表示为一个二进制的字符串,每一个二进制位有 0 和 1 两种状态,通过不同的排列组合,使用 0 和 1 就可以表示世界上所有的 东西。 在计算机种中,1 字节对应 8 位二进制数,而每位二进制数有 0、1 两种状态, 因此 1 字节可以组合出 256 种状态。如果这 256 中状态每一个都对应一个符 号,就能通过 1 字节的数据表示 256 个字符。美国人于是就制定了一套编码(其 实就是个字典),描述英语中的字符和这 8 位二进制数的对应关系,这被称为 ASCII 码。 ASCII 码一共定义了 128 个字符,例如大写的字母 A 是 65(这是十进制数, 对应二进制是 0100 0001)。这 128 个字符只使用了 8 位二进制数中的后面 7 位,最前面的一位统一规定为 0。
在这里插入图片描述

但是随着计算机的全球普及,128 个字符无法保存其他国家的字符。因此出现了
很多自己国家的编码,例如中国的 GB2312 编码,日本把日文编到 Shift_JIS 里,韩 国把韩文编到 Euc-kr 里。这样就解决了各个国家保存字符的问题。但是,如果在 中国使用 GB2312 编码写的内容,我们使用 U 盘拷一份去日本然后再使用日本的 电脑打开,就会出现乱码。为了解决这个问题,出现了‘万国码’Unicode。 Unicode 规定了世界上所有的字符都对应一个唯一的编号,但是没有规定在电脑 上怎么保存。例如’我’这个字符对应的编号是‘12345’,这个‘12345’这个编 码具体怎么在电脑上保存(占两个字节还是占三个字节)Unicode 没有规定。 UTF-8 编码是对 Unicode 的具体实现,UTF-8 规定了字符在电脑上的保存形式。 UTF-8 最大特点就是可变长。它可以使用 1 - 4 个字节表示一个字符,根据字符 的不同变换长度。 英文还是占 1 个字节,中文占 3 个字节。 注: UTF-8 编码实现了 ASCII 码的向后兼容,对于英文中的 0 - 127 号字符,与 ASCII 码完全相同。使用 ASCII 码编写的内容,使用 UTF-8 同样能打开。

转义字符

引入: 向控制台 打印 msg=’tom’s phone number is 110’这句话。
在这里插入图片描述

我们发现报错了,因为程序将’tom’看成了一个字符串而后面的字符串出现了语 法错误。怎么解决这个问题呢?我们可以使用双引号或者使用转义字符来解决。 使用双引号:
在这里插入图片描述

使用转义字符:
在这里插入图片描述

转义字符:顾名思义改变原有字符的意义。 转义字符格式: \特定字符。
在这里插入图片描述

在这里插入图片描述

注意”\t”
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值