python中字符串的处理_python中的字符串处理

类型

方法

注解

填充

center(width[, fillchar]),

ljust(width[, fillchar]),

rjust(width[, fillchar]),

zfill(width),

expandtabs([tabsize])

fillchar 参数指定了用以填充的字符,默认为空格

zfill的z为zero的缩写,顾名思义,是以字符0进行填充,用于数值输出

expandtabs()的tabsize 参数默认为8。它的功能是把字符串中的制表符(tab)转换为适当数量的空格。

删减

strip([chars]),

lstrip([chars]),

rstrip([chars])

chars为指定要去掉的字符,默认为空白字符,它由string.whitespace常量定义

变形

lower(),#全部小写

upper(),#全部小写

capitalize(),#首字母大写

swapcase(),#大小写交换

title()#每个单词第一个大写,其他小写

因为title() 函数并不去除字符串两端的空白符也不会把连续的空白符替换为一个空格,

所以建议使用string 模块中的capwords(s)函数,它能够去除两端的空白符,再将连续的空白符用一个空格代替。

>>> ‘ hello world!’.title()

‘ Hello World!’

>>> string.capwords(‘ hello world!’)

‘Hello World!’

切割

partition(sep),

rpartition(sep),

splitlines([keepends]),

split([sep [,maxsplit]]),

rsplit([sep[,maxsplit]])

partition()函数族是2.5版本新增的方法。它接受一个字符串参数,并返回一个3个元素的 tuple 对象。

如果sep没出现在母串中,返回值是 (sep, ‘’, ‘’);

否则,返回值的第一个元素是 sep 左端的部分,第二个元素是 sep 自身,第三个元素是 sep 右端的部分。

参数 maxsplit 是分切的次数,即最大的分切次数,所以返回值最多有 maxsplit+1 个元素。

s.split() 和 s.split(‘ ‘)的返回值不尽相同

>>> ‘ hello world!’.split()

['hello', 'world!']

>>> ‘ hello world!’.split(‘ ‘)

['', '', 'hello', '', '', 'world!']

产生差异的原因在于当忽略 sep 参数或sep参数为 None 时与明确给 sep 赋予字符串值时 split() 采用两种不同的算法。

对于前者,split() 先去除字符串两端的空白符,然后以任意长度的空白符串作为界定符分切字符串

即连续的空白符串被当作单一的空白符看待;

对于后者则认为两个连续的 sep 之间存在一个空字符串。因此对于空字符串(或空白符串),它们的返回值也是不同的:

>>> ”.split()

[]

>>> ”.split(‘ ‘)

['']

连接

join(seq)

join() 函数的高效率(相对于循环相加而言),使它成为最值得关注的字符串方法之一。

它的功用是将可迭代的字符串序列连接成一条长字符串,如:

>>> conf = {‘host’:’127.0.0.1′,

… ‘db’:'spam’,

… ‘user’:'sa’,

… ‘passwd’:'eggs’}

>>> ‘;’.join("%s=%s"%(k, v) for k, v in conf.iteritems())

‘passswd=eggs;db=spam;user=sa;host=127.0.0.1′

判定

isalnum(),

isalpha(),

isdigit(),

islower(),

isupper(),

isspace(),

istitle(),

startswith(prefix[, start[, end]]),

endswith(suffix[,start[, end]])

这些函数都比较简单,顾名知义。需要注意的是*with()函数族可以接受可选的 start, end 参数,善加利用,可以优化性能。

另,自 Py2.5 版本起,*with() 函数族的 prefix 参数可以接受 tuple 类型的实参,当实参中的某人元素能够匹配,即返回 True。

查找

count( sub[, start[, end]]),

find( sub[, start[, end]]),

index( sub[, start[, end]]),

rfind( sub[, start[,end]]),

rindex( sub[, start[, end]])

find()函数族找不到时返回-1,index()函数族则抛出ValueError异常。

另,也可以用 in 和 not in 操作符来判断字符串中是否存在某个模板。

替换

replace(old, new[,count]),

translate(table[,deletechars])

replace()函数的 count 参数用以指定最大替换次数

translate() 的参数 table 可以由 string.maketrans(frm, to) 生成

translate() 对 unicode 对象的支持并不完备,建议不要使用。

编码

encode([encoding[,errors]]),

decode([encoding[,errors]])

这是一对互逆操作的方法,用以编码和解码字符串。因为str是平台相关的,它使用的内码依赖于操作系统环境,

而unicode是平台无关的,是Python内部的字符串存储方式。

unicode可以通过编码(encode)成为特定编码的str,而str也可以通过解码(decode)成为unicode。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值