Python 中的 encode 和 decode 以及如何避免中文乱码

最新推荐文章于 2024-05-22 20:26:52 发布

zhrq95

最新推荐文章于 2024-05-22 20:26:52 发布

阅读量2k

点赞数

分类专栏： Python 文章标签： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhrq95/article/details/79292933

版权

Python 专栏收录该内容

28 篇文章 2 订阅

订阅专栏

Python2 默认的编码是 ascii，
通过 encode 可以将对象的编码转换为指定编码格式（称作“编码”），
而 decode 是这个过程的逆过程（称作“解码”）。

>>> a = "中"
>>> type(a)

>>> a
'\xe4\xb8\xad'
>>> len(a)
3

>>> b = a.decode()
>>> b
u'\u4e2d'
>>> type(b)

>>> len(b)
1

变量 a 引用了一个字符串，所谓字符串 (str)，严格地将是字节串，它是经过编码后的字节组成的序列，
上面的实验中，看到的是“中”这个字在计算机中编码之后的字节表示。用 len(a)来度量它的长度，它是由三个字节组成的。

然后通过 decode 函数，将字节串转变为字符串，并且这个字符串是按照 unicode 编码的，
在 unicode 编码中，一个汉字对应一个字符，这时候度量它的长度就是 1，
反过来，一个 unicode 编码的字符串，也可以转换为字节串。

>>> c = b.encode(‘utf-8’)
>>> c
'\xe4\xb8\xad'
>>> type(c)

>>> c == a
True

Python 中如何避免中文是乱码：
首先，提倡使用 utf-8 编码方案，因为它跨平台不错。
一：在开头声明：
# -*- coding: utf-8 -*-
也可以写成：
# coding:utf-8
二：遇到字符（节）串，立刻转化为 unicode，不要用 str()，直接使用 unicode()
unicode_str = unicode('中文', encoding='utf-8')
print unicode_str.encode('utf-8')
三：如果对文件操作，打开文件的时候，最好用 codecs.open，替代 open(这个后面会讲到，先放在这里)
import codecs
codecs.open('filename', encoding='utf8')

自己设置 python 默认编码为 utf8 的方法：
https://github.com/qiwsir/ITArticles/blob/master/Python/Python%E7%9A%84%E4%B8%AD%E6%96%87%E6%98%BE%E7%A4%BA%E6%96%B9%E6%B3%95.md

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Python 中的 encode 和 decode 以及如何避免中文乱码

Python2 默认的编码是 ascii，通过 encode 可以将对象的编码转换为指定编码格式（称作“编码”），而 decode 是这个过程的逆过程（称作“解码”）。&gt;&gt;&gt; a = "中"&gt;&gt;&gt; type(a)&gt;&gt;&gt; a '\xe4\xb8\xad'&gt;&gt;&gt; len(a)3
复制链接

扫一扫

专栏目录

zhrq95 CSDN认证博客专家 CSDN认证企业博客

码龄6年

92: 原创

18万+: 周排名

9万+: 总排名

15万+: 访问

: 等级

2392: 积分

38: 粉丝

81: 获赞

14: 评论

153: 收藏

私信

关注

热门文章

分类专栏

Python 28篇
Linux 17篇
C/C++ 16篇
SQL 19篇
计算机理论与基础 6篇
Other 2篇
树莓派 5篇
Docker 4篇
Java

最新评论

Python 操作文本文件
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。
Python 中的字典（ dict ）的基本操作
CSDN-Ada助手: 如何将自己的Python项目发布到PyPI?
MySQL 中的子查询
CSDN-Ada助手: 你的文章质量不错，值得学习！但还有一点小瑕疵，具体如下：(1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)增加条理清晰的目录；(3)使用更多的站内链接；(4)使用标准目录。
新的 systemctl 命令代替原来的 chkconfig、service 命令
viego1999: https://blog.csdn.net/qq_29856169/article/details/115488797?spm=1001.2101.3001.6650.3
新的 systemctl 命令代替原来的 chkconfig、service 命令
viego1999: chkconfig在Ubuntu18.x使用sysv-rc-conf替代

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。