乐搏TestPRO
字符串是Python中的一个重要的数据类型 ,对于字符串的操作,也有着很丰富的操作方法。
一、设置字符串的格式:在格式字符串中,最激动人心的部分为替换字段,替换字段有以下部分组成,其中每个部分都是可选的:(1) 字段名:索引或标识符,指出要设置哪个值的格式并使用结果来替换该字段。除指定值外,还可指定值的特定部分,如列表的元素。
(2) 转换标志:跟在叹号后面的单个字符。当前支持的字符包括r(表示repr)、 s(表示str)和a(表示ascii)。
(3) 格式说明符:跟在冒号后面的表达式(这种表达式是使用微型格式指定语言表示的)
二、替换字段名:将字符串中的参数进行值的替换有以下几种方式:
(1)向format提供要设置其格式的未命名参数,并在格式字符串中使用未命名字段, 此时,将按顺序将字段和参数配对。还可给参数指定名称,这种参数将被用于相应的替换字段中,这两种方式可以混合使用,例如:>>> "{foo} {} {bar} {}".format(1, 2, bar=4, foo=3)
'3 1 4 2
(2)通过索引来指定要在哪个字段中使用相应的未命名参数,这样可不按顺序使用未命名参数。>>> "{foo} {1} {bar} {0}".format(1, 2, bar=4, foo=3)
'3 2 4 1'
(3)使用索引,和句点表示法来访问导入的模块中的方法、属性、变量和函数,例如:>>> fullname = ["Alfred", "Smoketoomuch"]
>>> "Mr {name[1]}".format(name=fullname) #此处使用索引访问元组中的元素
'Mr Smoketoomuch'
>>> import math
>>> tmpl = "The {mod.__name__} module defines the value {mod.pi} for π" #此处的__name__是指定模块的名词,即math
>>> tmpl.format(mod=math)
'The math module defines the value 3.141592653589793 for π'
三. 基本转换:
(1)转换标志:指定要在字段中包含的值后,就可添加有关如何设置其格式的指令了。>>> print("{pi!s} {pi!r} {pi!a}".format(pi="π")) #(s、 r和a)指定分别使用str、 repr和ascii进行转换
π 'π' '\u03c0'
(2)格式说明符:例如你可能提供了一个整数,但要将其作为小数点处理,则可在冒号后面使用字符f。>>> "The number is {num}".format(num=42)
'The number is 42'
>>> "The number is {num:f}".format(num=42) #以浮点数类型转换
'The number is 42.000000'
>>> "The number is {num:b}".format(num=42) #作为二进制数进行处理
'The number is 101010'
补充:字符串格式设置中的类型说明符如下:b 将整数表示为二进制数
c 将整数解读为Unicode码点
d 将整数视为十进制数进行处理,这是整数默认使用的说明符
e 使用科学表示法来表示小数(用e来表示指数)
E 与e相同,但使用E来表示指数
f 将小数表示为定点数
F 与f相同,但对于特殊值(nan和inf),使用大写表示
g 自动在定点表示法和科学表示法之间做出选择。这是默认用于小数的说明符,但在默认情况下至少有1位小数
G 与g相同,但使用大写来表示指数和特殊值
n 与g相同,但插入随区域而异的数字分隔符
o 将整数表示为八进制数
s 保持字符串的格式不变,这是默认用于字符串的说明符
x 将整数表示为十六进制数并使用小写字母
X 与x相同,但使用大写字母
% 将数表示为百分比值(乘以100,按说明符f设置格式,再在后面加上%)
四. 宽度、精度和千分位分隔符:设置浮点数格式时,默认在小数点后保留6位,并根据需要设置精度或宽度。
(1)宽度:使用整数设定,如下:>>> "{num:10}".format(num=3)
' 3'
>>> "{name:10}".format(name="Bob")
'Bob ' #数和字符串的对齐方式是不同的
(2)精度:也是使用整数设定,但要在它前面加一个表示小数点的句点:>>> "Pi day is {pi:.2f}".format(pi=math.pi)
'Pi day is 3.14'
>>> "{pi:10.2f}".format(pi=math.pi) #也可以同时指定宽度和精度
' 3.14'
>>> "{:.5}".format("Guido van Rossum") #也可以对其他类型指定精度,这种做法不常见
'Guido'
(3)千位分隔符:使用逗号来指出你要添加的千位分隔符。>>> 'One googol is {:,}'.format(10**100)
'One googol is 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,00
0,000,000,000,000,000,000,000,000,000,000,000,000,000,000'
五. 符号、对齐和用0填充:用于设置字符串格式的机制,例如打印整齐的表格,多数情况下,只需指定宽度和精度。此外,当数据中包含负数后字符串+数字(字符串和数据的默认对齐方式不同)时,则需要修改默认对齐方式,可在指定宽度和精度的数前面,添加一个标志,如零、加号、减号或空格。
(1)用0填充:>>> '{:010.2f}'.format(pi)
'0000003.14'
(2)要指定左对齐、右对齐和居中,可分别使用和^:>>> print('{0:<10.2f}\n{0:^10.2f}\n{0:>10.2f}'.format(pi))
3.14 #左对齐
3.14 #居中
3.14 #右对齐
(3)使用填充字符来扩充对齐说明符,这样将使用指定的字符而不是默认的空格来填充:>>> "{:$^15}".format(" WIN BIG ")
'$$$ WIN BIG $$$
(4)还有更具体的说明符=,它指定将填充字符放在符号和数字之间:>>> print('{0:10.2f}\n{1:10.2f}'.format(pi, -pi))
3.14
-3.14
>>> print('{0:10.2f}\n{1:=10.2f}'.format(pi, -pi))
3.14
- 3.14
(5)如果要给正数加上符号,可使用说明符+(将其放在对齐说明符后面),而不是默认的-。如果将符号说明符指定为空格,会在正数前面加上空格而不是+。>>> print('{0:-.2}\n{1:-.2}'.format(pi, -pi)) #默认设置
3.1
-3.1
>>> print('{0:+.2}\n{1:+.2}'.format(pi, -pi))
+3.1
-3.1
>>> print('{0: .2}\n{1: .2}'.format(pi, -pi))
3.1
-3.1
(6)#符号可放在符号说明符和宽度之间,这个选项将触发另一种转换方式,转换细节随类型而异。例如对于二进制、八进制和十六进制转换,将加上一个前缀。>>> "{:b}".format(42)
'101010'
>>> "{:#b}".format(42)
'0b101010'
(7)对于各种十进制数,它要求必须包含小数点(对于类型g,它保留小数点后面的零)>>> "{:g}".format(42)
'42'
>>> "{:#g}".format(42)
'42.0000'
总结示例: 根据指定的宽度打印格式良好的价格列表width = int(input('Please enter width: '))
price_width = 10
item_width = width - price_width
header_fmt = '{{:{}}}{{:>{}}}'.format(item_width, price_width)
fmt = '{{:{}}}{{:>{}.2f}}'.format(item_width, price_width)
print('=' * width)
print(header_fmt.format('Item', 'Price'))
print('-' * width)
print(fmt.format('Apples', 0.4))
print(fmt.format('Pears', 0.5))
print(fmt.format('Cantaloupes', 1.92))
print(fmt.format('Dried Apricots (16 oz.)', 8))
print(fmt.format('Prunes (4 lbs.)', 12))
print('=' * width)
这个程序的运行情况类似于下面这样:
Please enter width: 35
===================================
Item Price
-----------------------------------
Apples 0.40
Pears 0.50
Cantaloupes 1.92
Dried Apricots (16 oz.) 8.00
Prunes (4 lbs.) 12.00
===================================
六. 字符串方法:Pyyhon中的很多方法是从模块string那里继承而来的,这些方法是模块python中的函数。模块sting中的几个很有用的常量: string.digits:包含数字0~9的字符串。
string.ascii_letters:包含所有ASCII字母(大写和小写)的字符串。
string.ascii_lowercase:包含所有小写ASCII字母的字符串。
string.printable:包含所有可打印的ASCII字符的字符串。
string.punctuation:包含所有ASCII标点字符的字符串。
string.ascii_uppercase:包含所有大写ASCII字母的字符串。
虽然说的是ASCII字符,但值实际上是未解码的Unicode字符串。
字符串常用方法如下:
(1)center:此方法通过在两边添加填充字符(默认为空格)让字符串居中。>>> "The Middle by Jimmy Eat World".center(39)
' The Middle by Jimmy Eat World '
>>> "The Middle by Jimmy Eat World".center(39, "*")
'*****The Middle by Jimmy Eat World*****'
(2)find:此方法find在字符串中查找子串。如果找到,就返回子串的第一个字符的索引,否则返回-1。>>> 'With a moo-moo here, and a moo-moo there'.find('moo')
7
>>> title = "Monty Python's Flying Circus"
>>> title.find('Monty')
0
>>> title.find('Python')
6
>>> title.find('Flying')
15
>>> title.find('Zirquss')
-1
>>> subject = '$$$ Get rich now!!! $$$' #还可以指定搜索的起点和终点
>>> subject.find('$$$')
0
>>> subject.find('$$$', 1) #只指定了起点,即从字符串索引为1的位置开始搜索$$$
20
>>> subject.find('!!!')
16
>>> subject.find('!!!', 0, 16) #同时指定了起点和终点, 第二个和第三个参数指定的搜索范围包含起点,但不包含终点
-1
(3)join:此方法与split相反,用于合并序列的元素。>>> lst = [1, 2, 3, 4, 5]
>>> sep = '+'
>>> sep.join(lst) # 尝试合并一个数字列表,故报错,所合并序列的元素必须都是字符串
Traceback (most recent call last):
File "", line 1, in ?
TypeError: lstuence item 0: expected string, int found
>>> lst = ['1', '2', '3', '4', '5']
>>> sep.join(lst) # 合并一个字符串列表
'1+2+3+4+5'
>>> dirs = '', 'usr', 'bin', 'env'
>>> '/'.join(dirs) #为路径添加了盘符
'/usr/bin/env'
>>> print('C:' + '\\'.join(dirs))
C:\usr\bin\env
(4)lower:此方法返回字符串的小写版本,在编写代码时,如果不想区分字符串的大小写(即忽略大小写的差别),这将很有用。>>> 'Trondheim Hammer Dance'.lower()
'trondheim hammer dance'
>>> name = 'Gumby'
>>> names = ['gumby', 'smith', 'jones']
>>> if name.lower() in names: print('Found it!')
...
Found it!
拓展:与lower相关的方法是title,它将字符串转换为词首大写,即所有单词首字母为大写,其他字母小写。>>> "that's all folks".title()
"That'S All, Folks" #title的缺点是确定单词边界的方式可能导致结果不合理
>>> import string
>>> string.capwords("that's all, folks") #另一种方法是使用模块string中的函数capwords
That's All, Folks"
(5)replace:此方法将指定子串都替换为另一个字符串,并返回替换后的结果。>>> 'This is a test'.replace('is', 'eez')
'Theez eez a test
(6)split:此方法是一个非常重要的字符串方法,其作用与join相反,用于将字符串拆分为序列。>>> '1+2+3+4+5'.split('+') #此处指定分隔符
['1', '2', '3', '4', '5']
>>> '/usr/bin/env'.split('/') #此处指定分隔符
['', 'usr', 'bin', 'env']
>>> 'Using the default'.split() #没有指定分隔符,将默认在单个或多个连续的空白字符(空格、制表符、换行符等)处进行拆分
['Using', 'the', 'default']
(7)strip:此方法将字符串开头和末尾的空白(但不包括中间的空白)删除,并返回删除后的结果。>>> ' internal whitespace is kept '.strip()
'internal whitespace is kept'
>>> '*** SPAM * for * everyone!!! ***'.strip(' *!') #在一个字符串参数中指定要删除哪些字符,此方法只删除开头或末尾的指定字符,因此中间的星号未被删除
'SPAM * for * everyone'
(8)translate:此方法与replace一样替换字符串的特定部分,但不同的是它只能进行单字符替换。优势在于能够同时替换多个字符,效率比replace高。
然而,使用translate前必须创建一个转换表。这个转换表指出了不同Unicode码点之间的转
换关系。要创建转换表,可对字符串类型str调用方法maketrans,这个方法接受两个参数:两个
长度相同的字符串,它们指定要将第一个字符串中的每个字符都替换为第二个字符串中的相应字
符①。就这个简单的示例而言,代码类似于下面这样:>>> table = str.maketrans('cs', 'kz')
如果愿意,可查看转换表的内容,但你看到的只是Unicode码点之间的映射。>>> table
{115: 122, 99: 107}
创建转换表后,就可将其用作方法translate的参数。>>> 'this is an incredible test'.translate(table)
'thiz iz an inkredible tezt'
调用方法maketrans时,还可提供可选的第三个参数,指定要将哪些字母删除。例如,要模
仿语速极快的德国口音,可将所有的空格都删除。>>> table = str.maketrans('cs', 'kz', ' ')
>>> 'this is an incredible test'.translate(table)
'thizizaninkredibletezt'
(9)补充:很多以is开头的方法用于判断字符串是否具有特定的性质,如果具备,则返回True,否则返回Flase。如:isalnum、 isalpha、 isdecimal、 isdigit、isidentifier、 islower、 isnumeric、isprintable、 isspace、 istitle、 isupper…
最后~送一波Python语言的福利,扫描↓备注简书 领取Python语言学习案例
乐搏TestPRO