一、字符串
1、字符串的驻留机制
2、字符串的查询操作
# 字符串的查询操作
s = 'hello,hello'
print(s.index('lo')) # 3
print(s.find('lo')) # 3 查找‘lo’第一次出现的位置
print(s.rindex('lo')) # 9
print(s.rfind('lo')) # 9 查找‘lo’最后一次出现的位置
# print(s.index('k')) # 抛出异常ValueError: substring not found
print(s.find('k')) # -1
# print(s.rindex('k')) # ValueError: substring not found
print(s.rfind('k')) # -1
3、字符串的大小写转换操作
# 字符串的大小写转换
s = 'hello,python'
a = s.upper() # 转成大写之后,会产生一个新的字符串对象
print(s)
print(a)
b = s.lower() # 转成小写之后,会产生一个新的字符串对象
print(s.lower(), id(s.lower()))
print(s, id(s))
print(b == s) # True
print(b is s) # False
s1 = 'hello,Python'
print(s1.swapcase())
print(s1.title())
运行结果:
4、字符串内容的对齐方式操作
# 字符串内容的对齐方式操作
s = 'hello,python'
# 居中对齐
print(s.center(20, '*'))
# 左对齐
print(s.ljust(20, '*'))
print(s.ljust(10)) # 设置宽度小于实际参数,则返回原字符串
print(s.ljust(20)) # 第二个参数没有,默认为空格
# 右对齐
print(s.rjust(20, '*'))
print(s.rjust(20)) # 第二个参数没有,默认为空格
print(s.rjust(10)) # 设置宽度小于实际参数,则返回原字符串
# 右对齐,使用0进行填充
print(s.zfill(20))
print(s.zfill(10)) # # 设置宽度小于实际参数,则返回原字符串
print('-8910'.zfill(8))
运行结果:
5、字符串的分割操作
# 从左侧开始分割
lst = s.split() # 默认为空格分割
print(lst)
s1 = 'hello|word|python'
print(s1.split(sep='|')) # sep指定分割字符串的分割符
print(s1.split(sep='|', maxsplit=1)) # maxsplit指定分割字符串的最大分割次数
print('---------------------------------')
# 从右侧开始分割
print(s.rsplit()) # 默认为空格分割
print(s1.rsplit(sep='|')) # sep指定分割字符串的分割符
print(s1.rsplit(sep='|', maxsplit=1)) # maxsplit指定分割字符串的最大分割次数
运行结果:
6、判断字符串的操作
# 判断字符串
# 判断指定的字符串是否符合标识符
s = 'hello,python'
print('1.', s.isidentifier()) # False
print('2.', 'hello'.isidentifier()) # True
print('3.', '张三'.isidentifier()) # True
print('4.', '张三_123'.isidentifier()) # True
# 判断指定的字符串是否全部由空白字符组成(回车、换行、水平置表符)
print('5.', '\t'.isspace()) # True
# 判断指定的字符串是否全部由字母组成
print('6.', 'abc'.isalpha()) # True
print('7.', '张三'.isalpha()) # True
print('8.', '张三1'.isalpha()) # False
# 判断指定的字符串是否全部由十进制的数字组成
print('9.', '123'.isdecimal()) # True
print('10.', '123四'.isdecimal()) # False
# 判断指定的字符串是否全部由数字组成
print('11.', '123'.isnumeric()) # True
print('12.', '123四'.isnumeric()) # True
# 判断指定的字符串是否全部由字母和数字组成
print('13.', 'abs2'.isalnum()) # True
print('14.', '张三122'.isalnum()) # True
print('15.', 'abc!'.isalnum()) # False
7、字符串操作的其他方法
# 字符串的替换
s = 'hello,Python'
print(s.replace('Python', 'Java'))
s1 = 'hello,Python,Python,Python'
print(s1.replace('Python', 'Java', 2))
# 字符串的合并
lst = ['hello', 'Java', 'Python']
print('|'.join(lst))
print(''.join(lst))
t = ('hello', 'Java', 'Python')
print(''.join(t))
print('*'.join('Python'))
运行结果:
8、字符串的比较操作
# 字符串的比较
print('abcd' > 'abc') # True
print('apple' > 'banana') # False
print(ord('a'), ord('b')) # 97 98
print(chr(97), chr(98)) # a b
'''==与is的区别
== 是比较的 value
is 是比较的 id'''
a = b = 'Python'
c = 'Python'
print(a == b) # True
print(b == c) # True
print(a is b) # True
print(a is c) # True
print(id(a)) # 2147626977840
print(id(b)) # 2147626977840
print(id(c)) # 2147626977840
9、字符串的切片操作
字符串是不可变类型,不具备增、删、改操作。
切片之后产生新的对象
# 字符串的切片
s = 'hello,Python'
s1 = s[:5] # 由于没有指定起始位置,所以从索引0开始切
s2 = s[6:] # 由于没有指定结束位置,所以切到字符串的最后一个元素
print(s1)
print(s2)
s3 = '!'
s4 = s1 + s3 + s2
print(s4)
print('--------切片[start:end:step]-----------')
print(s[1:5:1]) # 从1开始截到5(不包含5),步长为1
print(s[::2]) # 默认从0开始,默认到字符串最后一个元素,步长为2(两个元素之间的索引间隔为2)
print(s[::-1]) # 默认从字符串最后一个元素开始,到字符串的第一个元素结束(因为步长为负数)
print(s[-6::1]) # 从索引-6开始,到字符串最后一个元素结束,步长为1
运行结果:
10、格式化字符串
# 格式化字符串
# (1) % 占位符
name = '张三'
age = 15
print('我是%s,今年%d岁' % (name, age))
# (2){}占位符
print('我是{0},今年{1}岁'.format(name, age))
# (3)f-string
print(f'我是{name},今年{age}岁')
print('----------宽度和精度----------')
print('%10d' % 99) # 10表示宽度
print('%.3f' % 3.1415926) # .3表示小数点后三位
# 同时表示宽度和精度
print('%10.3f' % 3.1415926) # 一共总宽度为10,保留小数点后三位
print('{0:.3}'.format(3.1415926)) # .3表示一共是三位数, 0 表示占位符的顺序,也可以省略不写
print('{:.3f}'.format(3.1415926)) # .3f表示保留3位小数
print('{:10.3f}'.format(3.1415926)) # # 一共总宽度为10,保留小数点后三位
运行结果:
11、字符串的编码转换
# 字符串的编码转换
s = '天涯共此时'
# 编码
print(s.encode(encoding='GBK')) # 在GBK编码格式中,一个中文占两个字节
print(s.encode(encoding='UTF-8')) # 在UTF-编码格式这种,一共中文占三个字节
# 解码
byte = s.encode(encoding='GBK')
print(byte.decode(encoding='GBK'))
byte = s.encode(encoding='UTF-8')
print(byte.decode(encoding='UTF-8'))
运行结果: