字符串创建
- 使用单引号或双引号。
- str方法,str(非字符串参数)可将其他类型转换成字符串。
转义字符
- \n:换行符,新的一行开头。
- \r:回车符,移至本行开头。
- \t:水平制表符,下一组4个空格的开始处。
- \b:退格符,回退一个字符。
- \’: 单引号’。
- \": 双引号’’。
特殊字符串
- 字符串前加r,表示转义符不生效,但不能以单数\结束,可以\\结束。
- 字符串前加u,表示以Unicode格式进行编码,一般用在中文字符串前面,防止乱码。
- 字符串前加b,表示这是一个bytes对象,可以理解为二进制字节串,是比较特殊的字符串。
跨越多行的字符
- 三个引号(可嵌套。
- 在每行末尾加\。
字符串加法,乘法
- 加法将两个字符串连接,生成新的字符串。
- 乘法将字符串重复n次,生成新的字符串。
字符串查操作
- 通过索引查找元素,方法同列表:指定索引获得元素、通过切片获得元素。
- 获得子串的索引,指的是在字符串中查找子串,返回匹配的第一个字符的索引。
- 方法index、find、rindex、rfind:
字符串中存在多个子串时:
index、find返回第一个子串的索引。
rindex,rfind返回最后一个子串的索引。
字符串中不存在子串时:
index,rindex返回ValueError。
find,rfind返回-1。
字符串是不可变类型,无增删改
- 字符串的增删改实质都是创建新的字符串。
字符串的比较
- 字符串的比较,比较的是其ASCII值的大小。
ord(),参数是一个字符(可以是中文),返回其ASCII值(int型)。
chr(),参数是数字(int型),返回对应的字符。 - ==与is在字符串中无差异;==与is在列表中有差异。
字符串反转和截取
- 通过切片方式获得,例如:
a='abc'
b=a[::-1] # 字符串反转
c =a[1:3] # 字符串截取,下标从0开始,谨记左开右闭
print(a,b,c)
out:
abc cba bc
使用%作为占位符格式化字符串
- 包含%占位符的字符串’ % 实际值 ‘包含%占位符的字符串’ % (实际值1,实际值2……)。
- 格式化字符串中的%为普通字符时,需要转义为 %% 。
- 占位符%后面可以指定宽度和精度 例如:%6.3f 表示宽度6精度3的浮点数 。
使用{ }作为占位符格式化字符串
- 案例:
num=3.1415926
print(f'{num:.4f}') # 小数点后取3位,注意是四舍五入的
out:
3.1416
- 在{}中可以使用冒号来指定数字的表示形式。
{:d} 十进制数。
{:b} 二进制数。
{:x} 十六进制数,小写表示。
{:X} 十六进制数,大写表示。
{:f} 浮点数。
{:.2f} 小数点后取2位,四舍五入。
{:,} 千位分隔符。 - {}中可以指定宽度和精度。
{:m.n}数字的表示形式。
字符串的大小写转换
- 转化大小写:
s.upper() 全部转化为大写。
s.lower() 全部转化为小写。
s.swapcase() 所有小写变大写,所有大写变小写。
s.capitalize() 字符串首字母大写。
s.title() 所有单词首字母大写。 - 判断是否大小写:
s.isupper() 判断是否全部为大写。
s.islower() 判断是否全部为小写。
s.istitle() 判断是否所有字符首字母大写。
字符串的对齐方式
- 方法center,ljust,rjust:
不指定填充字符,默认为空格;若指定宽度小于字符串长度,则返回字符串本身。
s.center(字符串宽度,填充字符)。
s.ljust(字符串宽度,填充字符)。
s.rjust(字符串宽度,填充字符)。 - 方法zfill:
s.zfill(字符串宽度) 右对齐,左边用0填充。
字符串的子串替换,方法replace
- s.replace(匹配字符串,目标字符串,最大替换次数),最大替换次数也可不指定,表示无限制。
字符串的字符转换
- 方法maketrans和translate,可以理解为密码本编码、解码。
先用maketrans创建一个加密字典trantab。
然后s.translate(trantab)可转成密文。
可以再做个解密字典转回明文。
str1 = "this is string example wow!"
intab = "aoeiu" # 原字符和目标字符对应
outtab = "12345" # 将a转1,o转2等等
trantab = str1.maketrans(intab, outtab) # 加密字典
trantab2 = str1.maketrans(outtab, intab) # 解密字典
str2 = str1.translate(trantab)
str3 = str2.translate(trantab2)
print(str2)
print(str3)
out:
th4s 4s str4ng 3x1mpl3 w2w!
this is string example wow!
- 还可以用第三个参数指定需要删除的字符串:
str1 = "this is string example wow!"
intab = "aoeiu" # 原字符和目标字符对应
outtab = "12345" # 将a转1,o转2等等
trantab = str1.maketrans(intab, outtab,' ')
trantab2 = str1.maketrans(outtab, intab)
str2 = str1.translate(trantab)
str3 = str2.translate(trantab2)
print(str2)
print(str3)
out:
th4s4sstr4ng3x1mpl3w2w!
thisisstringexamplewow!
字符串的拆分
- s.split()从左向右寻找,根据拆分符将字符串拆分,分别放入列表。
- s.rsplit()从右向左寻找,根据拆分符将字符串拆分,分别放入列表。
上面2个方法都有参数:(maxsplit=次数,sep=‘拆分符’):
maxsplit=拆分次数,sep=‘拆分符’。 - s.splitlines()根据换行符\n将字符串拆分,分别放入列表:
partition(sep=‘拆分符’),rpartition(sep=‘拆分符’) ,将字符串拆分为三部分。 拆分符前面,拆分符,拆分符后面,然后将这三部分封装成元组作为方法返回值。 - s.partition(‘拆分符’) 从左边查找拆分符,第一次出现的地方拆分。
- s.rpartition(‘拆分符’) 从右边查找拆分符,第一次出现的地方拆分。
若字符串中不存在指定的拆分符:
rpartition返回的元组中字符串三部分为: 字符串本身,空字符串,空字符串。
rpartition返回的元组中字符串三部分为: 空字符串,空字符串,字符串本身。
字符串的合并
- 一是用 + 合并:
优点是代码简洁,缺点是效率低(每次合并都会新建字符串)。 - 二是用join()方法:
可将元组、列表、字典(key)转化为字符串,但它们的元素必须都是字符串,有非字符串会报错。示例如下:
list=['abb', 'bcc', 'cdd']
print(''.join(list)) # abbbcccdd
out:
abbbcccdd
在循环体中大量合并字符串时建议用join(),经测试比直接用+快了10倍不止。
import time
def strplus():
t1 = time.time()
str1 = ''
for i in range(1000000):
str1 += '中国人'
t2 = time.time()
return t2 - t1
def strjoin():
t1 = time.time()
list1 = []
for i in range(1000000):
list1.append('中国人')
str2 = ''.join(list1)
t2 = time.time()
return t2 - t1
print(strplus()) # 1.0035312175750732
print(strjoin()) # 0.08500289916992188
out:
1.0035312175750732
0.08500289916992188
以is开头的字符串方法
- s.isidentifier():判断字符串是否是合法的标识符。
- s.isspace(): 判断字符串是否全部由空格组成。
- s.isdecimal(): 判断字符串是否全部由十进制数组成。
- s.isnumeric(): 判断字符串是否全部由数字组成。
- s.isalnum(): 判断字符串是否仅由数字和字母组成。
- s.isalpha():判断字符串是否全部由字母组成。
去除字符串空白符方法strip、lstrip、rstri.ps
- strip([chars]) 缺省参数时移除头尾的空白符(\n、\t、\r、空格),指定参数时可移除指定字符。
- s.ltrip([chars]) 缺省参数时移除开头的空白符(\n、\t、\r、空格),指定参数时可移除指定字符。
- s.rtrip([chars]) 缺省参数时移除结尾的空白符(\n、\t、\r、空格),指定参数时可移除指定字符。