python 字符串和编码常用函数

最新推荐文章于 2024-05-15 00:07:30 发布

fy0004

最新推荐文章于 2024-05-15 00:07:30 发布

阅读量409

点赞数

分类专栏： python 文章标签：编码乱码函数

本文链接：https://blog.csdn.net/zqingyaa/article/details/52524948

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

首先我们要在我们的python源码文件的头部写上编码声明为 utf-8，这样我们在输入中文时就不会出现乱码的情况了。

# -*- coding:utf-8 -*-

对单个字符的转换

ord() 获取字符的整数表示
chr() 与ord() 功能相反，把一个编码转换成字符。

>>> ord('A')
65
>>> chr(66)
'B'

把字符串转换为bytes

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。
Python对bytes类型的数据用带b前缀的单引号或双引号表示：

b = b'ABC'

我们通过encode() 把字符串转换成指定的二进制。

>>> 'ABC'.encode('ascii')
b'ABC'
如果是中文我们就要转换成UTF-8编码,含有中文的str无法用ASCII编码，因为中文编码的范围超过了ASCII编码的范围，Python会报错。
>>> '中国'.encode('utf-8')
b'\xe4\xb8\xad\xe5\x9b\xbd'

把bytes转换为字符串

如果我们要读取字节流我们读取的是bytes，我们需要把bytes转换成字符串显示。我们可以使用decode().

>>> b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad\xe5\x9b\xbd'.decode('utf-8')
'中国'

本文结束！

fy0004

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 字符串和编码常用函数

首先我们要在我们的python源码文件的头部写上编码声明为 utf-8，这样我们在输入中文时就不会出现乱码的情况了。# -*- coding:utf-8 -*-对单个字符的转换ord() 获取字符的整数表示 chr() 与ord() 功能相反，把一个编码转换成字符。>>> ord('A')65>>> chr(66)'B'把字符串转换为bytes由于Python的字符串类型是str，在内存中以
复制链接

扫一扫

专栏目录