4.7.1.字符串方法
字符串实现所有常见的序列操作,以及下面描述的其他方法。
字符串还支持两种类型的字符串格式化的,一个提供了很大程度的灵活性和定制(见str.format()
, 格式化字符串的语法和自定义字符串格式化)和其他基于C printf
风格的格式,处理范围较窄的类型,是稍硬使用正确,但对于它可以处理的情况(printf样式的字符串格式)通常更快。
标准库的文本处理服务部分涵盖了许多其他模块,这些模块提供各种与文本相关的实用程序(包括re
模块中的正则表达式支持)。
str.
capitalize
()
返回字符串的副本,其首字符大写,其余字符小写。
str.
casefold
()
返回字符串的包含案例的副本。表壳折叠字符串可用于无壳匹配。
Casefolding类似于lowercasing但更具攻击性,因为它旨在删除字符串中的所有大小写区别。例如,德语小写字母'ß'
相当于"ss"
。因为它已经是小写的,所以lower()
什么都不做'ß'
; casefold()
将其转换为"ss"
。
案例折叠算法在Unicode标准的3.13节中描述。
版本3.3中的新功能。
str.
center
(width [,fillchar ] )
以长度宽度的字符串为中心返回。使用指定的fillchar完成填充(默认为ASCII空间)。如果width小于或等于,则返回原始字符串len(s)
。
str.
count
(sub [,start [,end ] ] )
返回[ start,end ] 范围内substring sub的非重叠出现次数。可选参数start和end被解释为切片表示法。
str.
encode
(encoding =“utf-8”,errors =“strict” )
将字符串的编码版本作为字节对象返回。默认编码是'utf-8'
。可以给出错误以设置不同的错误处理方案。错误的默认值是'strict'
,意味着编码错误会引发错误UnicodeError
。其他可能的值'ignore'
,'replace'
,'xmlcharrefreplace'
,'backslashreplace'
和其他任何名义通过挂号 codecs.register_error()
,见错误处理程序。有关可能的编码列表,请参阅标准编码部分。
在3.1版中更改:添加了对关键字参数的支持。
str.
endswith
(后缀[,开始[,结束] ] )
返回True
字符串是否与指定的结束后缀,否则返回 False
。 后缀也可以是要查找的后缀元组。通过可选的 启动,从该位置开始测试。使用可选结束,停止在该位置进行比较。
str.
expandtabs
(tabsize = 8 )
返回字符串的副本,其中所有制表符由一个或多个空格替换,具体取决于当前列和给定的制表符大小。每个制表符字符都会出现制表符位置(默认值为8,在第0,8,16列等位置给出制表符位置)。要展开字符串,请将当前列设置为零,并逐个字符地检查字符串。如果字符是制表符(\t
),则在结果中插入一个或多个空格字符,直到当前列等于下一个制表符位置。(不会复制制表符本身。)如果字符是换行符(\n
)或返回(\r
),它被复制,当前列重置为零。任何其他字符都将保持不变,当前列将加1,无论打印时字符的表示方式如何。
>>>
>>> '01\t012\t0123\t01234'.expandtabs()
'01 012 0123 01234'
>>> '01\t012\t0123\t01234'.expandtabs(4)
'01 012 0123 01234'
str.
find
(sub [,start [,end ] ] )
返回在切片中找到substring sub的字符串中的最低索引s[start:end]
。可选参数start和end被解释为切片表示法。-1
如果未找到sub,则返回。
注意
find()
只有在需要知道sub的位置时才应使用该方法。要检查sub是否是子字符串,请使用 in
运算符:
>>>
>>> 'Py' in 'Python'
True
str.
format
(* args,** kwargs )
执行字符串格式化操作。调用此方法的字符串可以包含由大括号分隔的文字文本或替换字段 {}
。每个替换字段都包含位置参数的数字索引或关键字参数的名称。返回字符串的副本,其中每个替换字段都替换为相应参数的字符串值。
>>>
>>>