python中字符串

目录

1、字符串

2、什么叫字符串驻留机制呢?

3、驻留机制的几种情况(交互模式)

4、sys中的intern方法强制2个字符串指向同一个对象

5、PyCharm对字符串进行了优化处理(所以上述两个例子都是在cmd下运行的)

6、字符串驻留机制的优缺点

7、字符串的常用操作

 8、字符串的大小写转换操作的方法

9、字符串内容对齐操作的方法

 10、字符串劈分操作

11、判断字符串操作的方法

12、替换与合并

13、字符串的比较操作

 14、字符串的切片操作

15、格式化字符串

16、字符串的编码转换


1、字符串

在Python中字符串是基本数据类型,是一个不可变的字符序列

2、什么叫字符串驻留机制呢?

仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串的驻留池中, Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量

3、驻留机制的几种情况(交互模式)

①字符串的长度为0或1时

②符合标识符的字符串

③字符串只在编译时进行驻留,而非运行时

例如下图,c是在运行时,通过join方法对列表的数据进行连接的

 ④[-5,256]之间的整数数字

4、sys中的intern方法强制2个字符串指向同一个对象

5、PyCharm对字符串进行了优化处理(所以上述两个例子都是在cmd下运行的)

6、字符串驻留机制的优缺点

当需要值相同的字符串时,可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。

在需要进行字符串拼接时建议使用str类型的join方法,而非+ ,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比"+"效率高

7、字符串的常用操作

功能方法名称作用
查询方法index()查找子串substr第一次出现的位置,如果查找的子串不存在时,则抛出ValueError
rindexO查找子串substr最后一次出现的位置,如果查找的子串不存在时,则抛出ValueError
find()查找子串substr第一次出现的位置,如果查找的子串不存在时,则返回-1
rfind()查找子串substr最后一次出现的位置,如果查找的子串不存在时,则返回-1

例子:

#字符串的查询操作
s='hello,hello'
print(s.index('lo'))
print(s.find('lo'))
print(s.rindex('lo'))
print(s.rfind('lo'))

输出结果:

图示说明:

 

例子:

#print(s.index('k'))   #ValueError: substring not found找不到时会抛出错误
print(s.find('k'))    #即使不存在也不会抛出错误
#print(s.rindex('k'))   #ValueError: substring not found找不到时会抛出
print(s.rfind('k'))     #即使不存在也不会抛出错误

输出结果:

 8、字符串的大小写转换操作的方法

功能方法名称作用
大小写转换upper()把字符串中所有字符都转成大写字母
lower()把字符串中所有字符都转成小写字母
swapcase()把字符串中所有大写字母转成小写字母,把所有小写字母都转成大写字母
capitalize()把第一个字符转换为大写,把其余字符转换为小写
title()把每个单词的第一个字符转换为大写,把每个单词的剩余字符转换为小写

例子:

#字符串的大小写转换的方法
s='hello,python'
a=s.upper()  #转化大写之后会产生一个新的字符串对象
print(s,id(s))
print(a,id(a))
b=s.lower()  #转化之后,会产生一个新的字符串对象,即使时小写转小写
print(b,id(b))
print(s,id(s))
print(b==s)
print(b is s)

s2='hello,Python'
print(s2.swapcase())

print(s2.title())

输出结果:

9、字符串内容对齐操作的方法

 

功能方法名称作用
字符串对齐center()居中对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则则返回原字符串
ljust()左对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格如果设置宽度小于实际宽度则则返回原字符串
rjust()右对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格如果设置宽度小于实际宽度则则返回原字符串
zfil1()右对齐,左边用0填充,该方法只接收一个参数,用于指定字符串的宽度,如果指定的宽度小于等于字符串的长度,返回字符串本身

例子:

='hello,python'

'''居中对其'''
print(s.center(20,'*'))

'''左对齐'''
print(s.ljust(20,'*'))
print(s.ljust(10,'*'))  #如果设置的宽度过小,那么会返回原字符
print(s.ljust(20))  #如果填充符不写就默认是空格

'''右对齐'''
print(s.rjust(20,'*'))
print(s.rjust(20))
print(s.rjust(10,'*'))

'''右对齐,使用0填充'''
print(s.zfill(20))
print(s.zfill(10))
print('-8910'.zfill(8))

输出结果:

 10、字符串劈分操作

功能方法名称作用
宁符串的劈分split()从字符串的左边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表
以通过参数sep指定劈分字符串是的劈分符
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次劈分之后,剩余的子串会单独做为一部分
rsplit()串会单独做为一部分
以通过参数sep指定劈分字符串是的劈分符
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次劈分之后,剩余的子串会单独做为一部分

例子:

s='hello world Python'
lst=s.split()
print(lst)    #没有指定分隔符就按默认的分隔符:空格
s1='hello|world|Python'
print(s1.split(sep='|'))
print(s1.split(sep='|',maxsplit=1))

'''rsplit()从右侧开始劈分'''
print(s.rsplit())
print(s1.rsplit('|'))
print(s1.rsplit(sep='|',maxsplit=1))  #从右边开始分,将左边的看成一个整体

输出结果:

11、判断字符串操作的方法

功能方法名称作用

判断字符串

的方法

isidentifier()判断指定的字符串是不是合法的标识符
isspace()判断指定的字符串是否全部由空白字符组成(回车、换行,水平制表符)
isalpha ()判断指定的字符串是否全部由字母组成
isdecimal()判断指定字符串是否全部由十进制的数字组成
isnumeric()判断指定的字符串是否全部由数字组成
isalnum()判断指定字符串是否全部由字母和数字组成

 例子:

s='hello,python'
print('1.','s'.isidentifier())  #False
print('2.','hello'.isidentifier())  #True
print('3.','张三'.isidentifier())  #True
print('4.','张三_123'.isidentifier())  #True

print('5.','\t'.isalpha())  #True

print('6','abc'.isalpha())  #True
print('7.','张三'.isalpha())  #True
print('8.','张三1'.isalpha())   #False

print('9.','123'.isdecimal())    #True
print('10.','123四'.isdecimal())   #False
print('11.','ⅠⅡⅢ'.isdecimal())    #False

print('12.','123'.isnumeric())  #True
print('13.','123四'.isnumeric())  #True
print('14.','ⅡⅢⅢ'.isnumeric())  #True


print('15.','abc'.isalnum())   #True
print('16','张三123'.isalnum())   #True
print('17.','abc'.isalnum())   #False

输出结果:

 

12、替换与合并

功能方法名称作用
字符串替换replace()第1个参数指定被替换的子串,第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串,替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数
字符串的合并join()将列表或元组中的字符串合并成一个字符串

例子:

s='hello,Python'
print(s.replace('Python','Java'))
s1='hello.Python,Python,Python'
print(s1.replace('Python','Jvaa',2))

lst=['hello','Java','Python']
print('|'.join(lst))
print('|'.join(lst))

t=('hello','Java','Python')
print(''.join(t))


print('*'.join('Python'))

输出结果:

 

13、字符串的比较操作

①运算符:>,>=,<,<=,==,l=

②比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较

③比较原理:两上字符进行比较时,比较的是其ordinal value(原始值),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr调用内置函数chr时指定ordinal value可以得到其对应的字符

例子:

print('apple'>'app')  #True
print('apple'>'hanana')  #False,相当于是97>98 False
print(ord('a'),ord('b'))

print(chr(97),chr(98))
print(chr(26472))

''' ==与is的与别
  == 比较的是value
  is  比较的是id是否相等
'''
a=b='Python'
c='Python'
print(a==b)
print(b==c)

print(a is b)
print(a is c)
print(id(a))
print(id(b))
print(id(c))

输出结果:

 14、字符串的切片操作

字符串是不可变类型

不具备增、删、改等操作

切片操作将产生新的对象

图示:

 例子:

='hello,Python'
s1=s[:5]   #由于没有指定起始位置,所以从0开始切
s2=s[6:]   #由于没有指定结束位置,所以它会切到字符串的最后一个元素
s3='!'
newstr=s1+s2+s3

print(s1)
print(s2)
print(newstr)
print('------------------------')
print(id(s))
print(id(s1))
print(id(s2))
print(id(s3))
print(id(newstr))

print('----------------切片[star:end:step]-----------')
print(s[1:5:1])  #从1开始截到5(不包含5),步长为1
print(s[::2])  #默认从0开始,默认到字符串的最后一个,步长为2,两个元素之间的索引间隔为2
print(s[::-1])   #默认从字符串最后一个元素开始,到字符串的第一个字符元素结束,因为步长为负数
print(s[-6::1])   #从索引为-6k开始,到字符串的最后一个元素结束,步长为1

输出结果:

 

15、格式化字符串

(1)格式化字符串的两种方式

①%作占位符

②{}作占位符

例子:

(1) % 占位符
name='张三'
age=20
print('我叫%s,今年%d岁' % (name,age))
#(2) {}
print('我叫{0},今年{1}岁'.format(name,age))

#(3) f-string
print('我叫{name},今年{age}岁')

#宽度和精度设置
print('%10d' % 99)  #这里的10表示的是宽度
print('hellohello')  #这个字符串的宽度刚好为10,可以跟上面的对比看
print('%.3f' % 3.1415926)   #表示小数点后三位

print('{0:.3}'.format(3.1415926))  #这个0也可以不写,但如果花括号多的话还是写的号
#.3不是三位小数

print('{:.3f}'.format(3.1415926))  #.3f表示3位小数
print('{:10.3f}'.format(3.1415926))  #同时设置宽度和精度,宽度位10,精度位3

输出结果:

 

16、字符串的编码转换

(1)为什么需要字符串的编码转换

 

(2)编码与解码的方式

编码:将字符串转换为二进制数据(bytes)

解码:将bytes类型的数据转换成字符串类型

例子:

s='天涯共此时'

#编码
print(s.encode(encoding='GBK'))  #在GBK这种编码格式中,一个中文占两个字节
print(s.encode(encoding='UTF-8')) #在UTF-8这种编码格式中,一个中文占三个字节

#解码
byte=s.encode(encoding='GBK')  #编码
print(byte.decode(encoding='GBK'))   #解码
#print(byte.decode(encoding='UTF-8'))   #会抛出异常,因为编码的格式和解码的格式要相同
byte=s.encode(encoding='UTF-8')  #编码
print(byte.decode(encoding='UTF-8'))

输出结果:

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值