字符串的驻留机制
仅保存一份相同且不可变字符串的方法。相同的字符串内容赋给不同的变量,其变量id是相同的。
驻留机制的几种情况(在IDLE中才能看到):
1、字符串的长度为0或1
2、符合标识符的字符串(仅含字母、数字、下划线)
3、字符串仅在编译时进行驻留,而非运行时
4、[-5,256之间的整数数字]
sys中的extern方法强制2个字符串指向了同一个对象
Pycharm对字符串处理进行了优化,不符合上述某些要求的会被强制驻留。
好处:避免了频繁的创建和销毁对象,提升效率和节约内存,因此拼接字符串和修改字符串是比较影响性能的。
另外,在需要进行字符串拼接时,建议使用str类型的join()方法,而非“+”,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比“+”效率高。
字符串的常用操作
字符串的查询操作的方法
index()
查找子串substr第一次出现的位置,如果查找的子串不存在时,则抛出ValueError
rindex()
查找子串substr最后一次出现的位置,如果查找的子串不存在时,则抛出ValueError
find()
查找子串substr第一次出现的位置,如果查找的子串不存在时,则返回-1
rfind()
查找子串substr最后一次出现的位置,如果查找的子串不存在时,则返回-1
字符串的大小写转换操作的方法
upper()大写
lower()小写
swapcase()大变小,小变大
capitalize()第一个字符大,其余字符小
title()每个单词首字母大写
注:字符串不可变,转换大小写以后会产生新的字符串。本身是小写,转换成小写仍然产生了一个新的字符。
字符串内容对齐操作的方法
center()
居中对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则则返回原字符串
ljust)
左对齐,后面描述同上。
rjust()
右对齐,后面描述同上。
zfi11()
右对齐,右边用0填充,该方法只接收一个参数,用于指定字符串的宽度,如果指定的宽度小于等于字符串的长度,返回字符串本身
注:该函数如果被用于一个负数,则0会补充到负号后面,字符串宽度含负号
字符串劈分操作的方法
split()
从字符串的左边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表。
可以通过参数sep指定分隔字符串的劈分符。比如s1.split(sep='|')
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次号分之后,剩余的子串会单独做为一部分。比如s1.split(sep='|',maxsplit=1)表示只劈一次。
rsplit()
从字符串的右边开始劈分,后面描述同上。
判断字符串操作的方法
isidentifier()
判断指定的字符串是不是合法的标识符。Python允许汉字作为标识符。
isspace()
判断指定的字符串是否全部由空白字符组成(回车、换行,水平制表符)。
isalpha()
判断指定的字符串是否全部由字母组成。
isdecimal()
判断指定字符串是否全部由十进制的数字组成。
isnumeric()
判断指定的字符串是否全部由数字组成。罗马数字也可以。
isalnum()
判断指定字符串是否全部由字母和数字组成。
字符串操作的其它方法
replace ()
第1个参数指定被替换的子串,第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串,替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数。
s.replace('Python','Java')
join()
将列表或元组中的字符串合并成一个字符串。
print('$',join(lst))
字符串的比较操作
字符串的比较操作
运算符:>,>=,<,<=,==,!=
比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较。
比较原理:两上字符进行比较时,比较的是其ordinal value(原始值),调用内置函数ord可以 得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符。
其实比较的就是ASCII码。ord()与chr()是相反操作。
字符串的切片操作
字符串是不可变类型,不具备增删改的相关操作,切片操作将产生新的对象。
[start:stop:step]
s1=s[:5]
s2=s[6:]
s1+'!'+s2
格式化字符串
name=Jack
age=20
方式1:%作占位符
print ('我叫%s,今年%d岁' % (name,age))
方式2:{}作占位符
print('我叫{0},今年{1}岁我真的叫{0}.fomat(name,age))
方式3:f-string
print('我叫{name},今年{age}岁')
补充:
print('%10d', % 99)#10表示的是宽度
print('%.3f' % 3.1415926)#保留3位小数
print('%10.3f' % 3.1415926)
print ('{}'.fomat(3.1415826))
..这边有很多种写法,用到时自行百度就行了。
字符串的编码转换
s=’天涯共此时’
#编码
print(s. encode (encoding='GBK'))
#在GBK这种编码格中一个中文占两个字节
print(s. encode (encoding='UTF-8'))
#在UTF-8这种编辑格式中,一个中文占三个字节
#解码
#byte代表就是一个二进制数据(字节类型的数据)
byte=s.encode(encoding='GBK') #编码
print (byte. decode (encoding=' GBK'))#解码