Python基础入门-编码

最新推荐文章于 2022-09-30 22:13:28 发布

melon524

最新推荐文章于 2022-09-30 22:13:28 发布

阅读量194

点赞数 1

分类专栏： Python基础入门文章标签：字符串 python base64 unicode

本文链接：https://blog.csdn.net/weixin_46020795/article/details/119219965

版权

Python基础入门专栏收录该内容

13 篇文章 1 订阅

订阅专栏

编码

要点：
1.选择字符集编码的时候，最佳的选择(默认)是utf-8编码
2.编码和解码的字符要保持一致，否则会出现乱码的现象
3.不能使用ISO-8859-1编码保存中文，否则会出现编码黑洞，中文会变成 ’ ？’
4.UTF-8是Unicode的一种实现方案，一种变长的编码，最少1个字节（英文和数字），最多四个四个字节（表情），表示中文用3个字节
例子：

# gbk 一个中文对应两个字节
# utf-8 一个中文占三个字节
content4 = '我爱你中国love'
b = content4.encode('utf-8')
c = b.decode('utf-8')
print(b, c)
content5 = '🌂🍺'
b = content5.encode()
print(b)
print(b.decode())

运行结果：
在这里插入图片描述

base64编码

base64此编码方式可以让中文字或者图片也能在网路上顺利传输。
在 BASE64 编码后的字串只包含英文字母大小写、阿拉伯数字、加号与反斜线，共 64 个基本字元，不包含其它特殊的字元，因而才取名 BASE64。编码后的字串比原来的字串长度再加 1/3 左右。
具体转换步骤
第一步，将待转换的字符串每三个字节分为一组，每个字节占8bit，那么共有24个二进制位。
第二步，将上面的24个二进制位每6个一组，共分为4组。
第三步，在每组前面添加两个0，每组由6个变为8个二进制位，总共32个二进制位，即四个字节。
第四步，根据Base64编码对照表（见下图）获得对应的值。
注意事项
1. 大多数编码都是由字符串转化成二进制的过程，而Base64的编码则是从二进制转换为字符串。与常规恰恰相反，
2. Base64编码主要用在传输、存储、表示二进制领域，不能算得上加密，只是无法直接看到明文。也可以通过打乱Base64编码来进行加密。
3. 中文有多种编码（比如：utf-8、gb2312、gbk等），不同编码对应Base64编码结果都不一样。

import base64
a = "hello,world"
b = a.encode() # 转换为二进制，默认utf-8
c = base64.b64encode(b) # 转换为base64编码
print(c)
d = base64.b64decode(c) # 转换为二进制

运行结果：
在这里插入图片描述

melon524

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python基础入门-编码

编码要点：1.选择字符集编码的时候，最佳的选择(默认)是utf-8编码2.编码和解码的字符要保持一致，否则会出现乱码的现象3.不能使用ISO-8859-1编码保存中文，否则会出现编码黑洞，中文会变成 ’ ？’4.UTF-8是Unicode的一种实现方案，一种变长的编码，最少1个字节（英文和数字），最多四个四个字节（表情），表示中文用3个字节例子：# gbk 一个中文对应两个字节# utf-8 一个中文占三个字节content4 = '我爱你中国love'b = content4.enco
复制链接

扫一扫