关于python的编解码(decode, encode)

最新推荐文章于 2024-03-14 23:11:52 发布

walter1990

最新推荐文章于 2024-03-14 23:11:52 发布

阅读量504

点赞数

分类专栏：编程语言

本文链接：https://blog.csdn.net/suichen1/article/details/50320399

版权

编程语言专栏收录该内容

6 篇文章 0 订阅

订阅专栏

仅适用于python2.x

默认编码与开头声明：

首先开头的地方声明编码：

#coding:utf8

这个东西的用处是声明文件编码为utf8(要写在前两行内)。

python2.x文件默认的编码是ascii

开头加上那句默认编码声明就会变成utf8.

获取当前的默认编码：

sys.getdefaultencoding()

uincode与utf8：

在python中，使用unicode类型作为编码的基本类型，编码要以其为中间形式过度，即先将其他编码的字符串解码(decode)成unicode，再从unicode编码(encode)成另外一种编码。

decode的作用是将其他编码的字符串转换成unicode编码。

如str1.decode('gb2312')，表示将gb2312编码的字符串转换成unicode编码

encode的作用是将unicode编码转换为其他编码的字符串

如str2.encode('gb2312')，表示将unicode编码的字符串转换成gb2312编码

unicode是一种字符编码方法，是“与存储无关的表示”，而utf8是一种以unicode进行编码的计算机二进制表示，或者说传输规范。

具体过程：

具体的转换，比如直接将一个字符串encode成另一种字符表示，此处是字符串，即type为str，引号前没有加u前缀的。

s=‘美丽’

s.encode('gbk')

实际上会先以默认编码进行decode，即decode('ascii'),开头声明了utf8，s的编码就是utf8，ascii解码不了uft8的字符就会报错。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

walter1990

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中binascii库和encode、decode的使用

bobwpppppppp的博客

08-05

1655

参考： python中encode相关解释：https://zhuanlan.zhihu.com/p/33220501 编码格式科普：https://zhuanlan.zhihu.com/p/33220501 binascii官方文档：https://docs.python.org/zh-cn/3/library/binascii.html 其他：基于PyQt5的上位机：https://gitee.com/aaronlai/PyQt5-SerialPort-Stable?_from=gite

encode和encoding python区别_python 中 decode 与 encode 区别（摘抄）

weixin_29568097的博客

01-15

1483

为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)”？本文就来研究一下这个问题。------------------------------------------------------------------------------...

参与评论您还未登录，请先登录后发表或查看评论

python decode()函数初解

无限大地NLP_空木的专栏

10-18

1426

python字符集，没弄懂的菜鸟怕是

python3 文本过滤与清理处理文本成ASCII字符 encode()与decode()

anlian523的博客

05-30

1万+

将所有Unicode十进制数字字符，转换成ASCII版数字字符：import unicodedata ,sys digitmap = {c:ord('0') + unicodedata.digit(chr(c)) for c in range(sys.maxunicode) if unicodedata.category(chr(c)) == 'Nd...

python对字符编码的处理（源码篇）

jrl137824675的专栏

05-23

903

示例代码如下其中，a直接回车打印的是16进制编码，print a打印的是汉字，怎么做到的？变量名+回车的方式首先注意我们是在交互环境，输入的内容会立即解析，其源头就是将标准输入当成了读取文件一样： int Py_Main(int argc, char **argv) { ... sts = PyRun_AnyFileExFlags( ...

详解Python解决抓取内容乱码问题（decode和encode解码）

09-19

总结，Python中处理乱码问题的核心是理解字符串的编码与解码过程，并通过`decode`和`encode`方法进行转换。在实际应用中，要确保正确识别和处理目标网页的编码格式，以避免乱码现象。在遇到编码问题时，学会使用上述...

Python3字符串encode与decode的讲解

09-19

### Python3字符串encode与decode详解 #### 一、引言在Python3中，字符串处理是非常常见且重要的操作之一。由于Python3默认采用Unicode作为其内部字符串编码方式，因此在处理不同编码格式（如UTF-8、GBK等）的...

Python中编码【encode】解码【decode】讲解

m0_74872863的博客

03-31

649

编码和解码，其实就是str与bytes的相互转化的过程（Python 2已经远去，这里以及后面都只用Python 3举例）所有的字符，在unicode字符集中都有对应的编码值（code point）而在Python 3中，默认使用的是uft-8来读取，所以省了不少的事。就是我们说的编码方式，常见的有：UTF-8，GB2312等。你会看到有一个confidence字段，其表示预测的可信度，在Python 2中，默认使用的是ASCII编码来读取的，也就是说，当我们要将内存中的字符串持久化到硬盘中的时候，

彻底解决Qt中文乱码以及汉字编码的问题(UTF-8/GBK)

qq_656236576的博客

09-11

1万+

一、Qt Creator环境设置 1、cpp或h文件从window上传到Ubuntu后会显示乱码,原因是因为ubuntu环境设置默认是utf-8,Windows默认都是GBK. 我们使用的Windows系统本地字符集编码为GBK。 2、Windows环境下,Qt Creator,菜单->工具->选项->文本编辑器->行为->文件编码->默认编码,常用的选项有以下几个: System(简体中文windows系统默认指的是GBK编码) GBK/windows-936-2000

python中base64库用法详解

热门推荐

IT之一小佬的博客

07-23

4万+

python中base64库用法详解

Decode详解

Gunther的博客

08-04

1532

http://www.shiyanbar.com/ctf/1831 Decode： flag格式:ctf{} 0x25346425353425343525333525343325366125343525373725346425353125366625373825346425343425363725346225346625353425366225346225346425353425343525

python 字符串和decode()解码,encode()编码

公子清羽的博客

07-05

301

计算机系统通用的字符编码工作方式：计算机是有自己的工作区的，这个工作区被称为“内存”。数据在内存当中处理时，使用的格式是Unicode，统一标准。在计算机内存中，计算机使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件。所谓的编码，其实本质就是把str（字符串）类型的数据，利用不同的编码表，转换成bytes（..

Python3 的编码解码

wk的博客

06-23

1318

Python3的编码解码梳理一下编码方面的知识点。一、字符编码发展史 1、ASCII 背景：计算机设计8个比特（bit）作为一个字节（byte），即 1 字节对应 8 位二进制数，而每位二进制数有 0、1两种状态，因此 1 字节可以组合出 256 种状态。由此，美国设计出ASCII编码字典，英文字母和一些符号对应这些8位二进制数。说明：1个字节代表一个字符。例如：A 的编码为 65（对应二...

python学习笔记（一）——编码与格式化

SpicedSpicedPorkRice的博客

09-13

327

编码对于单个字符的编码，Python提供了ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符： print(ord('A')) print(ord('中')) print(chr(66)) print(chr(25994)) 如果知道字符的整数编码，还可以用十六进制这么写str： print('\u4e2d\u6587\u658a') Python对bytes类...

chatgpt赋能python：Python中的decode函数介绍

yakuchrisfor的博客

05-31

627

在计算机科学中，"编码"用于将字符集的字符映射为二进制数的过程，而"解码"用于将二进制数据解释为字符。编码和解码是文本数据传输和存储中的基本概念。例如，在英语中，字符集通常有26个大写字母、26个小写字母和10个数字。这些字符可以通过ASCII编码映射为0到127之间的整数。在ASCII编码中，大写字母"A"对应的数字是65，小写字母"a"对应的数字是97。然而，在其他语言中，字符集可能很大，并且需要更复杂的编码方案。UTF-8编码是一种用于将Unicode字符映射为字节序列的编码方案。

python字符编码使用ascii编码_Python2/3的中、英文字符编码与解码输出： UnicodeDecodeError: 'ascii' codec can't decode/encode...

weixin_39977586的博客

12-02

796

Python中文虐我千百遍，我待Python如初恋。本文主要介绍在Python2/3交互模式下，通过对中文、英文的处理输出，理解Python的字符编码与解码问题(以点破面)。前言：字符串的编码一开始是 ascii，只支持英文，由于多种语言的存在，出现万国码 unicode，但 unicode 不兼容 ascii，而且对存储空间造成浪费，所以出现 utf-8 编码，一种针对 unicode 的可变长...

python中decode和encode的使用

yjsfl_xiang的专栏

09-11

956

python中的编码是采用unicode编码的，在做编译转换时，需要使用unicode作为中间编码：首先：将其他编码的字符串解码：decode成unicode；另外，从unicode编码成另一种编码就使用encode！用法：str.decode("ascii")：将ascii编码的字符串str解码称为unicode编码 str.encode("a

python3中的编码问题