Python encode方法:XX.encode(‘utf-8‘)究竟是什么？

程序米虫

于 2020-07-24 11:44:44 发布

阅读量2.3w

点赞数 14

分类专栏：编程文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_49551075/article/details/107556997

版权

编程专栏收录该内容

1 篇文章

订阅专栏

Python encode方法:XX.encode(‘utf-8’)究竟是什么？

在Python学习中，我们经常会碰到这些内容：

S.encode([encoding='utf-8'][,errors='strict'])

在这里插入图片描述
这时，我们会想等会去看看这究竟是什么？然后，就没有等会了。。。

当然，也有人会觉得记就完事了。但不管怎样，我在这里简单讲一下它，希望帮助到大家。

一.描述

encode() 方法以指定的编码格式编码字符串，默认编码为 ‘utf-8’。

对应的解码方法：bytes decode() 方法，bytes:字节。该方法返回编码后的字符串，它是一个 bytes 对象

实例：
在这里插入图片描述

二.语法

S.encode([encoding='utf-8'][,errors='strict'])

encoding – 可选参数，要使用的编码，默认编码为 ‘utf-8’。

errors – 可选参数，设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。其他可能得值有 ‘ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值
（在使用encode()方法时，报错原因一般都是errors参数问题，改为‘ignore’就好了）

小结：

bytes通过decode（）转换为str（字符串）

str通过encode（）转换为bytes（二进制）

在python3中，encode（）和decode（）默认使用UTF-8

ASCII 、unicode 是字符集，utf-8是字符集的编码方式。

utf-8 是 unicode 字符集一种编码方式。

python3使用unicode字符集，而python2使用ASCII，所以python2使用中文很麻烦

这里特别需要注意的，是什么时候要用的encode()返回的byte对象（建议再看看python的编码问题）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。