字符串
字符串处理方法
一旦生成,内容不可改变
>>>my_str='hello'
>>>my_str[1]='a'
TypeError
返回一个新字符串,不改变原来的
- str.lower()/str.upper()
#返回全小写/大写
str.swapcase()
#大->小,小->大
>>> 'advgs'.upper()
'ADVGS'
>>> 'Hello'.swapcase()
'hELLO'
- str.title()
返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写
(见 istitle()) - str.split(sep=None)
>>> 'as,w,era'.split(',')
['as', 'w', 'era']
- str.count(sub)
>>> 'ankkjavnfan;a'.count('a')
4
- str.replace(old,new)
>>> 'lmn'.replace('n','www')
'lmwww'
- str.center(width[,fillchar])
>>> 'char'.center(20,'*')
'********char********'
- str.strip(chars)
str.strip() #移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
#不能删除中间部分的字符。
- str.join(iter)
#与split相反
- ljust()方法
str.ljust(width[, fillchar])#width -- 指定字符串长度。
#fillchar -- 填充字符,默认为空格。
返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。
str.rjust(width[, fillchar])
-
字符串子串搜索
-
center方法
str.center(width[, fillchar])
返回一个原字符串居中,并使用空格填充至长度 width 的新字符串。填充字符为filichar。
x='hello'
print(x.center(30,'*'))
>>>************hello*************
实现字符串反转
-
切片
result = s[::-1] -
reverse方法
l = list(s)
l.reverse()
result = “”.join(l)l = list(s)
result = “”.join(l[::-1]) -
reduce方法
result = reduce(lambda x,y:y+x,s)
字符串测试方法
str.isdigit()——用来判断字符串中是否全为数字。而浮点数因为有 “.” ,所以会返还FALSE。
字节串
Python 3.X 除了支持Unicode编码的str类型字符串之外,还支持字节串类型bytes。
对str类型的字符串调用其encode()方法进行编码得到bytes字节串,
对bytes字节串调用其decode()方法并指定正确的编码格式则得到str字符串。
bytes(x) #生成字节串,把指定对象x转换为字节串表示形式
>>> type('Hello world') #默认字符串类型为str
<class 'str'>
>>> type(b'Hello world') #在定界符前加上字母b表示字节串
<class 'bytes'>
>>> 'Hello world'.encode('utf8') #使用utf8编码格式进行编码
b'Hello world'
>>> 'Hello world'.encode('gbk') #使用gbk编码格式进行编码
b'Hello world'
>>> '董付国'.encode('utf8') #对中文进行编码
b'\xe8\x91\xa3\xe4\xbb\x98\xe5\x9b\xbd'
>>> _.decode('utf8') #一个下划线表示最后一次正确输出结果
'董付国'
>>> '董付国'.encode('gbk')
b'\xb6\xad\xb8\xb6\xb9\xfa'
>>> _.decode('gbk') #对bytes字节串进行解码
'董付国'