目录
1. 字符串的基本操作
所有标准序列操作(索引、切片、乘法、成员资格检查、长度、最小值和最大值)都适用于字符串,但字符串是不可变的,因此所有的元素赋值和切片赋值都是非法的。
2. 设置字符串格式
2.1 替换字段名
向format 提供要设置其格式的未命名参数,并在格式字符串中使用未命名字段。此时,将按顺序将字段和参数配对。你还可给参数指定名称,这种参数将被用于相应的替换字段中。
>>> "{foo} {} {bar} {}".format(1, 2, bar=4, foo=3)
'3 1 4 2'
还可通过索引来指定要在哪个字段中使用相应的未命名参数,这样可不按顺序使用未命名参数。
>>> "{foo} {1} {bar} {0}".format(1, 2, bar=4, foo=3)
'3 2 4 1'
不能同时使用手工编号和自动编号,因为这样很快会变得混乱不堪。
你并非只能使用提供的值本身,而是可访问其组成部分。
可使用索引,还可使用句点表示法来访问导入的模块中的方法、属性、变量和函数(看起来很怪异的变量__name__ 包含指定模块的名称)。
>>> fullname = ["Alfred", "Smoketoomuch"]
>>> "Mr {name[1]}".format(name=fullname)
'Mr Smoketoomuch'
>>> import math
>>> tmpl = "The {mod.__name__} module defines the value {mod.pi} for π"
>>> tmpl.format(mod=math)
'The math module defines the value 3.141592653589793 for π'
2.2 基本转换
指定要在字段中包含的值后,就可添加有关如何设置其格式的指令了。首先,可以提供一个转换标志 。
>>> print("{pi!s} {pi!r} {pi!a}".format(pi="π"))
π 'π' '\u03c0'
上述三个标志(s 、r 和a )指定分别使用str 、repr 和ascii 进行转换。
函数str 通常创建外观普通的字符串版本(这里没有对输入字符串做任何处理)。函数repr 尝试创建给定值的Python表示(这里是一个字符串字面量)。函数ascii 创建只包含ASCII字符的表示。
还可指定要转换的值是哪种类型,更准确地说,是要将其视为哪种类型。例如,你可能提供一个整数,但将其作为小数进行处理。为此可在格式说明(即冒号后面)使用字符f (表示定点数 )。
>>> "The number is {num}".format(num=42)
'The number is 42'
>>> "The number is {num:f}".format(num=42)
'The number is 42.000000'
也可以将其作为二进制数进行处理。
>>> "The number is {num:b}".format(num=42)
'The number is 101010'
表1 字符串格式设置中的类型说明符
类型 | 含义 |
---|---|
b | 将整数表示为二进制数 |
c | 将整数解读为Unicode码点 |
d | 将整数视为十进制数进行处理,这是整数默认使用的说明符 |
e | 使用科学表示法来表示小数(用e 来表示指数) |
E | 与e 相同,但使用E 来表示指数 |
f | 将小数表示为定点数 |
F | 与f 相同,但对于特殊值(nan 和inf ),使用大写表示 |
g | 自动在定点表示法和科学表示法之间做出选择。这是默认用于小数的说明符,但在默认情况下至少有1位小数 |
G | 与g 相同,但使用大写来表示指数和特殊值 |
n | 与g 相同,但插入随区域而异的数字分隔符 |
o | 将整数表示为八进制数 |
s | 保持字符串的格式不变,这是默认用于字符串的说明符 |
x | 将整数表示为十六进制数并使用小写字母 |
X | 与x 相同,但使用大写字母 |
% | 将数表示为百分比值(乘以100,按说明符f 设置格式,再在后面加上%) |
2.3 宽度、精度和千位分隔符
设置浮点数(或其他更具体的小数类型)的格式时,默认在小数点后面显示6位小数,并根据需要设置字段的宽度,而不进行任何形式的填充。
宽度是使用整数指定的。数和字符串的对齐方式不同。
>>> "{num:10}".format(num=3)
' 3'
>>> "{name:10}".format(name="Bob")
'Bob '
精度也是使用整数指定的,但需要在它前面加上一个表示小数点的句点。
>>> "Pi day is {pi:.2f}".format(pi=pi)
'Pi day is 3.14'
可同时指定宽度和精度。
>>> "{pi:10.2f}".format(pi=pi)
' 3.14'
对于其他类型也可指定精度,但是这样做的情形不太常见。
>>> "{:.5}".format("Guido van Rossum")
'Guido'
可使用逗号来指出你要添加千位分隔符 。
>>> 'One googol is {:,}'.format(10**100)
'One googol is 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,00
0,000,000,000,000,000,000,000,000,000,000,000,000,000,000'
同时指定其他格式设置元素时,这个逗号应放在宽度和表示精度的句点之间。如果要使用随区域而异的千位分隔符,应使用类型说明符n 。
2.4 符号、对齐和用0填充
修改默认对齐方式。在指定宽度和精度的数前面,可添加一个标志。这个标志可以是零、加号、减号或空格,其中零表示使用0来填充数字。
>>> '{:010.2f}'.format(pi)
'0000003.14'
要指定左对齐、右对齐和居中,可分别使用< 、> 和^ 。
>>> print('{0:<10.2f}\n{0:^10.2f}\n{0:>10.2f}'.format(pi))
3.14
3.14
3.14
可以使用填充字符来扩充对齐说明符,这样将使用指定的字符而不是默认的空格来填充。
>>> "{:$^15}".format(" WIN BIG ")
'$$$ WIN BIG $$$'
还有更具体的说明符= ,它指定将填充字符放在符号和数字之间。
>>> print('{0:10.2f}\n{1:10.2f}'.format(pi, -pi))
3.14
-3.14
>>> print('{0:10.2f}\n{1:=10.2f}'.format(pi, -pi))
3.14
- 3.14
如果要给正数加上符号,可使用说明符+ (将其放在对齐说明符后面),而不是默认的- 。如果将符号说明符指定为空格,会在正数前面加上空格而不是+ 。
>>> print('{0:-.2}\n{1:-.2}'.format(pi, -pi)) #默认设置
3.1
-3.1
>>> print('{0:+.2}\n{1:+.2}'.format(pi, -pi))
+3.1
-3.1
>>> print('{0: .2}\n{1: .2}'.format(pi, -pi))
3.1
-3.1
井号(# )。可将其放在符号说明符和宽度之间(如果指定了这两种设置)。这个选项将触发另一种转换方式,转换细节随类型而异。例如,对于二进制、八进制和十六进制转换,将加上一个前缀。
>>> "{:b}".format(42)
'101010'
>>> "{:#b}".format(42)
'0b101010'
对于各种十进制数,它要求必须包含小数点(对于类型g ,它保留小数点后面的零)。
>>> "{:g}".format(42)
'42'
>>> "{:#g}".format(42)
'42.0000'
3. 字符串方法
模块string 中几个常量:
- string.digits :包含数字0~9的字符串
- string.ascii_letters :包含所有ASCII字母(大写和小写)的字符串
- string.ascii_lowercase :包含所有小写ASCII字母的字符串
- string.printable :包含所有可打印的ASCII字符的字符串
- string.punctuation :包含所有ASCII标点字符的字符串
- string.ascii_uppercase :包含所有大写ASCII字母的字符串
虽然说的是ASCII字符,但值实际上是未解码的Unicode字符串。
3.1 center
方法center 通过在两边添加填充字符(默认为空格)让字符串居中。
>>> "The Middle by Jimmy Eat World".center(39)
' The Middle by Jimmy Eat World '
>>> "The Middle by Jimmy Eat World".center(39, "*")
'*****The Middle by Jimmy Eat World*****'
3.2 find
方法find 在字符串中查找子串。如果找到,就返回子串的第一个字符的索引,否则返回-1 。
字符串方法find 返回的并非 布尔值。如果find 像这样返回0 ,就意味着它在索引0处找到了指定的子串。
>>> 'With a moo-moo here, and a moo-moo there'.find('moo')
7
>>> title = "Monty Python's Flying Circus"
>>> title.find('Monty')
0
>>> title.find('Python')
6
>>> title.find('Flying')
15
>>> title.find('Zirquss')
-1
还可指定搜索的起点和终点(它们都是可选的)
起点和终点值(第二个和第三个参数)指定的搜索范围包含起点,但不包含终点。
>>> subject = '$$$ Get rich now!!! $$$'
>>> subject.find('$$$')
0
>>> subject.find('$$$', 1) # 只指定了起点
20
>>> subject.find('!!!')
16
>>> subject.find('!!!', 0, 16) # 同时指定了起点和终点
-1
3.3 join
join 是一个非常重要的字符串方法,其作用与split 相反,用于合并序列的元素。
所合并序列的元素必须都是字符串。
>>> seq = [1, 2, 3, 4, 5]
>>> sep = '+'
>>> sep.join(seq) # 尝试合并一个数字列表
# Traceback (most recent call last):
# File "<stdin>", line 1, in ?
# TypeError: sequence item 0: expected string, int found
>>> seq = ['1', '2', '3', '4', '5']
>>> sep.join(seq) # 合并一个字符串列表
'1+2+3+4+5'
>>> dirs = '', 'usr', 'bin', 'env'
>>> ''.join(dirs)
'usr/bin/env'
>>> print('C:' + '\\'.join(dirs))
C:\usr\bin\env
3.4 lower
方法lower 返回字符串的小写版本。
>>> 'Trondheim Hammer Dance'.lower()
'trondheim hammer dance'
词首大写
将字符串转换为词首大写,即所有单词的首字母都大写,其他字母都小写。然而,它确定单词边界的方式可能导致结果不合理。
>>> "that's all folks".title()
"That'S All, Folks"
另一种方法是使用模块string 中的函数capwords 。
>>> import string
>>> string.capwords("that's all, folks")
That's All, Folks"
3.5 replace
方法replace 将指定子串都替换为另一个字符串,并返回替换后的结果。
>>> 'This is a test'.replace('is', 'eez')
'Theez eez a test'
3.6 splite
split 是一个非常重要的字符串方法,其作用与join 相反,用于将字符串拆分为序列。
>>> '1+2+3+4+5'.split('+')
['1', '2', '3', '4', '5']
>>> 'usr/bin/env'.split('/')
['', 'usr', 'bin', 'env']
>>> 'Using the default'.split()
['Using', 'the', 'default']
3.7 strip
方法strip 将字符串开头和末尾的空白(但不包括中间的空白)删除,并返回删除后的结果。
>>> ' internal whitespace is kept '.strip()
'internal whitespace is kept'
还可在一个字符串参数中指定要删除哪些字符。这个方法只删除开头或末尾的指定字符,因此中间的星号未被删除。
>>> '*** SPAM for everyone!!! ***'.strip(' *!')
'SPAM for everyone'
3.8 translate
方法translate 与replace 一样替换字符串的特定部分,但不同的是它只能进行单字符替换。这个方法的优势在于能够同时替换多个字符,因此效率比replace 高。
使用translate 前必须创建一个转换表 。这个转换表指出了不同Unicode码点之间的转换关系。要创建转换表,可对字符串类型str 调用方法maketrans ,这个方法接受两个参数:两个长度相同的字符串,它们指定要将第一个字符串中的每个字符都替换为第二个字符串中的相应字符。
>>> table = str.maketrans('cs', 'kz')
>>> table
{115: 122, 99: 107}
创建转换表后,就可将其用作方法translate
的参数。
>>> 'this is an incredible test'.translate(table)
'thiz iz an inkredible tezt'
调用方法maketrans
时,还可提供可选的第三个参数,指定要将哪些字母删除。
>>> table = str.maketrans('cs', 'kz', ' ')
>>> 'this is an incredible test'.translate(table)
'thizizaninkredibletezt'
3.9 判断字符串是否满足特定的条件
很多字符串方法都以is 打头,如isspace 、isdigit 和isupper ,它们判断字符串是否具有特定的性质(如包含的字符全为空白、数字或大写)。如果字符串具备特定的性质,这些方法就返回True ,否则返回False 。