python 字符串

最新推荐文章于 2022-03-22 19:08:04 发布

zcy2452430695

最新推荐文章于 2022-03-22 19:08:04 发布

阅读量135

点赞数

文章标签： python

本文链接：https://blog.csdn.net/zcy2452430695/article/details/113193499

版权

python 字符串

1.对于单个字符的编码，Python提供了ord()函数获取字符的整数表示

 ord('a')
    print(ord('a'))

可得出’a’= 97

 ord('你')
    print(ord('你'))

可得出’你’=20320

2.chr()函数把编码转换为对应的字符

chr(66)
    print(chr(66))

可得出编码66是 B

chr(22221)
    print(chr(22221))

囍

可得出编码22221是囍

如果知道字符的整数编码，还可以用十六进制这么写例如：中文

'\u4e2d\u6587'
print('\u4e2d\u6587')

中文

3.由于Python的字符串类型是`str`，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把`str`变为以字节为单位的`bytes`。

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

x = b'ABC'

4.如果我们从网络或磁盘上读取了字节流，那么读到的数据就是`bytes`。要把`bytes`变为`str`，就需要用`decode()`方法：

>>>b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'

5.如果`bytes`中包含无法解码的字节，`decode()`方法会报错：

>>> b'\xe4\xb8\xad\xff'.decode('utf-8')
Traceback (most recent call last):
  ...
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 3: invalid start byte

如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节：

>>> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')
'中'

6.`len()`函数：可用来计算`str`中包含多少字符

>>> len('ABC')
3
>>> len('中文')
2

len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：

>>> len(b'ABC')
3
>>> len(b'\xe4\xb8\xad\xe6\x96\x87')
6
>>> len('中文'.encode('utf-8'))
6

由上可见一个中文字符经过UTF-8编码后通常会占用3个字节，而1个英文字符只占用1个字节。

*在操作字符串时，我们经常遇到str和bytes的互相转换。为了避免乱码问题，应当始终坚持使用UTF-8编码对str和bytes进行转换。

由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时，为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

format()

一种格式化字符串的方法是使用字符串的format()方法，它会用传入的参数依次替换字符串内的占位符{0}、{1}……，

>>> 'Hello, {0}, 成绩提升了 {1}%'.format('小明', 17.125)
'Hello, 小明, 成绩提升了 17.125%'

以上多为参考网上资料，仅供个人学习。

zcy2452430695

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python 字符串

python 字符串

1.对于单个字符的编码，Python提供了**ord()**函数获取字符的整数表示

2.chr()函数把编码转换为对应的字符

3.由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

4.如果我们从网络或磁盘上读取了字节流，那么读到的数据就是bytes。要把bytes变为str，就需要用decode()方法：

5.如果bytes中包含无法解码的字节，decode()方法会报错：

6.len()函数：可用来计算str中包含多少字符

format()

1.对于单个字符的编码，Python提供了ord()函数获取字符的整数表示

3.由于Python的字符串类型是`str`，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把`str`变为以字节为单位的`bytes`。

4.如果我们从网络或磁盘上读取了字节流，那么读到的数据就是`bytes`。要把`bytes`变为`str`，就需要用`decode()`方法：

5.如果`bytes`中包含无法解码的字节，`decode()`方法会报错：

6.`len()`函数：可用来计算`str`中包含多少字符