python编码解码的过程_python中的编码与解码

最新推荐文章于 2024-07-26 09:40:54 发布

weixin_39675728

最新推荐文章于 2024-07-26 09:40:54 发布

阅读量196

点赞数

文章标签： python编码解码的过程

python2和python3中重大的不同是string的类型不同，在python2中，string其实是对应于字节流，而在python3中则直接对应于unicode字符集，如下例子所示：

在python2中string相当于字节流

#python2

>>> astr = "你好"

>>> astr

b"\xe4\xbd\xa0\xe5\xa5\xbd"

>>> "你好" is b"\xe4\xbd\xa0\xe5\xa5\xbd"

True

>>> u'\u4f60\u597d' is b"\xe4\xbd\xa0\xe5\xa5\xbd"

False

这里的 b"\xe4\xbd\xa0\xe5\xa5\xbd"是"你好"的16进制的字节表示方式，而u'\u4f60\u597d'为"你好"的unicode编号，也是以16进制的方式展示的。

而在python3中string相当于unicode字符集

#python3

>>> astr = "你好"

>>> astr

"你好"

>>> u'\u4f60\u597d'

'你好'

>>> u'\u4f60\u597d' is '你好'

True

由此引出的编码与解码的问题我们可以使用如下的图来帮助理解

a78d46416a67

编码与解码

由上图可以看到，我们将Unicode字符集与字节流进行转换时会产生编码与解码的问题，编码规则就是我们常见的utf-8，ascii，gbk等这些。由字节流转换为Unicode字符集的过程就叫解码，而由Unicode字符集转换字节流的过程则叫编码。

接下来看下编码与解码的示例

#python2

>>> astr = "你好"

>>> astr.decode("utf-8") #从字节流依据utf-8编码规则转换为unicode字符集

u'\u4f60\u597d'

>>> unicode_str = u'你好'

>>> unicode_str

u'\u4f60\u597d'

>>> unicode_str.encode("utf-8") #由 unicode字符集转换为字节流

b'\xe4\xbd\xa0\xe5\xa5\xbd'

#python3

>>> astr

'你好'

>>> astr.encode("utf-8") #由 unicode字符集编码成字节流

b'\xe4\xbd\xa0\xe5\xa5\xbd'

>>> b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode("utf-8")

'你好'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39675728

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Shannon_Python香农编码_python_shannon_香农编码_

10-02

在Python中实现香农编码，首先需要统计字符的出现频率，这可以通过构建一个字典来完成。例如，遍历文本文件，对每个字符进行计数，得到一个键为字符、值为频率的字典。接着，可以使用哈夫曼树（也称为最优二叉树）来...

JAVA方法字符串与unicode的相互转换

热门推荐

z69183787的专栏

05-13

6万+

unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。例如： 1)中文字符串"你好"的unicode码为：\u60\u597d; 2)英文字符串"ab"的unicode码为：\u0061\u0062；其中\u是标识unicode码用的，后面的4位16进制数则是对应字符的unicode码。 unicode码在J2EE项目中应用广

参与评论您还未登录，请先登录后发表或查看评论

Python编码encode()与解码decode()介绍与示例演示

lkr

04-19

1423

Python编码encode()与解码decode()介绍与示例演示 1、编码与解码介绍 2、GBK、GB2312与UTF8之间的转换 3、编码 encode() 4、解码 decode()

一文学习python中编码和解码

kymppcds的博客

02-18

3449

大家都知道计算机是二进制的世界，计算机系统只能识别数字0和1组成的一串串的数字。1位数字代表1个比特（bit），每8个比特代表1个字节（byte），那么1个字节如果都为数字1，如11111111，代表的最大数字是255。如果是2 个字节最大可以表示为 65535，4 个字节最大表示为4294967295。每一种不同的数字0和1的组合，就可以代表一个字符。ASCII 编码最开始是美国人发明的编码 ASCII ，只能表示 256 个字符，仅支持英文字母，数字和少部分符号。GBK 编码。

python中的编码与解码

jyh19960226的博客

07-21

1962

这篇文章主要讲的是python 中的编码和解码，纯属个人简介，若有不对的地方，希望各位大佬指正，万分感谢

python的解码和编码（贼细

m0_75271549的博客

09-15

926

python的解码和编码详细知识介绍和实例快速了解

HDB3.rar_HDB3_HDB3编码用python_HDB3解码_编码解码

09-24

通过这个压缩包中的"HDB3"文件，你将能够了解和实践HDB3编码解码的具体实现，从而更好地理解这种编码技术的工作原理。对于初学者来说，这将是一个很好的起点，有助于深入理解数字通信系统中的编码方法。

对python中url参数编码与解码的实例详解

09-18

本篇文章将详细讲解Python中URL参数的编码与解码，并通过实例进行演示。一、URL编码 URL编码是将URL中的特殊字符或非ASCII字符转换为百分号编码（%xx）的过程，其中xx是字符的ASCII值的十六进制表示。在Python中，...

Python中json格式数据的编码与解码方法详解

09-21

本篇文章将详细探讨JSON格式数据在Python中的编码和解码方法。 ### 1. JSON格式数据编码 **编码** 是将Python对象转换为JSON字符串的过程。在Python中，这个过程通过`json.dumps()`方法完成。以下是一个例子： ``...

【Python笔记】Python 中的编码与解码

RadiantJeral的博客

06-28

1925

本文记录 Python2.x 和 Python3.x 中关于编码和解码的问题.

python中解码和编码

qq_68455309的博客

04-23

341

decode()解码: ----------将编码后的字节解码成对应的明文。encode(编码方式)编码: -----拿到明文编码后对应的字节。英文: 16位二个字节。中文: 16位二个字节。英文: 32位四个字节。中文: 32位四个字节。2、支持:英文、数字、字母、符号。1、支持:中文、英文、数字、符号。1、支持:中文、英文、数字、符号。UTF-16 长度可变的万国码最少用16位。UTF-8 长度可变的万国码最少用8位。2、不支持:存储、传输。英文: 8位一个字节。

Python中的两种解码方式

qq_45751328的博客

04-02

322

urldata是需要解码的对象。#将字符串转换为字节。#将字节转换为字符串。

Python的编码和解码

qq_61986535的博客

11-24

1105

UTF编码将一个Unicode字符便面成一个1~6字节，英文被编译成1个字节，汉字被编译成3个字节，生僻字被编译成4~6字节。中文超过了256个，需要使用中文gb2312编码,使用两个字节，2的16次方共65526个汉字。用Unicode编码存储会比ASCII编码多占用一倍的空间，为了解决这个问题需要使用UTF编码。使用Unicode编码，无论是什么文本都不会出现乱码。使用2~4字节编码，拥有136690个字符。只占用1个，也就是二进制8位。将文件转换成二进制就是编码。Python的编码和解码。

彻底理解python3的编码和解码过程

weixin_48192256的博客

09-27

1869

1.在所有的编解码方式中，ASCIl码字符对应的二进制表示都是—样的。2.编解码要相对应，才能不损失数据原本的意义，才不会误解数据;数据以编码方式1进行编码得到字节流，那么这段字节流必须以对应的解码方式1进行解码，才可以得到原始的数据;否则这段字节流可能会:1.解码成别的数据〈按照解码方式2，这一段二进别位对应了别的字符)；2.解码失败〈按照解码方式2，这一段二进制位可能不对应任何字符)。

python中的解码与编码

weixin_43178406的博客

04-29

1万+

本文主要介绍了python中的解码与编码，希望能对学习Python的同学们有所帮助。文章目录 1. 基本概念 2. python中的编码与解码 3. 包含编码的字符串解码实例

Python_关于python2的encode（编码）和decode（解码）的使用

GDYY3721的博客

07-05

2777

在使用Python2时，我们习惯于在文件开头声明编码不然在文件中出现中文，运行时就会报错 SyntaxError: Non-ASCII character... 之类，这是因为python2的文件编码默认使用的如果在开头声明了编码，文件编码就会变为utf-8。

python之编码和解码

qq_44659804的博客

01-31

574

python之编码和解码

Python字符串编解码，解决字符串乱码问题