字符串(str)

木木的森林

已于 2023-02-09 16:29:26 修改

阅读量532

点赞数

分类专栏： Pyhton学习笔记文章标签： python 学习

于 2023-02-08 19:37:27 首次发布

本文链接：https://blog.csdn.net/m0_64332867/article/details/128942021

版权

Pyhton学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章详细介绍了Python字符串的驻留机制，强调了它在内存管理和性能提升上的作用。讨论了字符串的大小写转换、对齐、劈分、判断、替换等操作，以及比较、切片和格式化方法。此外，还提到了字符串的编码与解码过程，强调了在处理字符串时应注意的效率问题。

摘要由CSDN通过智能技术生成

字符串的驻留机制

仅保存一份相同且不可变字符串的方法。相同的字符串内容赋给不同的变量，其变量id是相同的。

驻留机制的几种情况（在IDLE中才能看到）：

1、字符串的长度为0或1

2、符合标识符的字符串（仅含字母、数字、下划线）

3、字符串仅在编译时进行驻留，而非运行时

4、[-5，256之间的整数数字]

sys中的extern方法强制2个字符串指向了同一个对象

Pycharm对字符串处理进行了优化，不符合上述某些要求的会被强制驻留。

好处：避免了频繁的创建和销毁对象，提升效率和节约内存，因此拼接字符串和修改字符串是比较影响性能的。

另外，在需要进行字符串拼接时，建议使用str类型的join(）方法，而非“+”，因为join()方法是先计算出所有字符中的长度，然后再拷贝，只new一次对象，效率要比“+”效率高。

字符串的常用操作

‌字符串的查询操作的方法

index()

查找子串substr第一次出现的位置，如果查找的子串不存在时，则抛出ValueError

rindex()

查找子串substr最后一次出现的位置，如果查找的子串不存在时，则抛出ValueError

find()

查找子串substr第一次出现的位置，如果查找的子串不存在时，则返回-1

rfind()

查找子串substr最后一次出现的位置，如果查找的子串不存在时，则返回-1

‌字符串的大小写转换操作的方法

upper()大写

lower()小写

swapcase()大变小，小变大

capitalize()第一个字符大，其余字符小

title()每个单词首字母大写

注：字符串不可变，转换大小写以后会产生新的字符串。本身是小写，转换成小写仍然产生了一个新的字符。

‌字符串内容对齐操作的方法

center()

居中对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则则返回原字符串

ljust)

左对齐，后面描述同上。

rjust()

右对齐，后面描述同上。

zfi11（)

右对齐，右边用0填充，该方法只接收一个参数，用于指定字符串的宽度，如果指定的宽度小于等于字符串的长度，返回字符串本身

注：该函数如果被用于一个负数，则0会补充到负号后面，字符串宽度含负号

‌字符串劈分操作的方法

split()

从字符串的左边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表。

可以通过参数sep指定分隔字符串的劈分符。比如s1.split(sep='|')

通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次号分之后，剩余的子串会单独做为一部分。比如s1.split(sep='|',maxsplit=1)表示只劈一次。

rsplit()

从字符串的右边开始劈分，后面描述同上。

‌判断字符串操作的方法

isidentifier()

判断指定的字符串是不是合法的标识符。Python允许汉字作为标识符。

isspace()

判断指定的字符串是否全部由空白字符组成(回车、换行，水平制表符)。

isalpha()

判断指定的字符串是否全部由字母组成。

isdecimal()

判断指定字符串是否全部由十进制的数字组成。

isnumeric()

判断指定的字符串是否全部由数字组成。罗马数字也可以。

isalnum()

判断指定字符串是否全部由字母和数字组成。

‌字符串操作的其它方法

replace ()

第1个参数指定被替换的子串，第2个参数指定替换子串的字符串，该方法返回替换后得到的字符串，替换前的字符串不发生变化，调用该方法时可以通过第3个参数指定最大替换次数。

s.replace('Python','Java')

join()

将列表或元组中的字符串合并成一个字符串。

print('$',join(lst))

字符串的比较操作

‌字符串的比较操作

运算符：>,>=,<,<=,==,!=

比较规则：首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较。

比较原理：两上字符进行比较时，比较的是其ordinal value(原始值），调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符。

其实比较的就是ASCII码。ord()与chr()是相反操作。

字符串的切片操作

字符串是不可变类型，不具备增删改的相关操作，切片操作将产生新的对象。

[start:stop:step]

s1=s[:5]

s2=s[6:]

s1+'!'+s2

格式化字符串

name=Jack

age=20

方式1：%作占位符

print ('我叫%s,今年%d岁' % (name,age))

方式2：{}作占位符

print（'我叫{0},今年{1}岁我真的叫{0}.fomat(name,age)）

方式3：f-string

print（'我叫{name},今年{age}岁'）

补充：

print（'%10d', % 99）#10表示的是宽度

print（'%.3f' % 3.1415926）#保留3位小数

print（'%10.3f' % 3.1415926）

print ('{}'.fomat(3.1415826))

..这边有很多种写法，用到时自行百度就行了。

字符串的编码转换

s=’天涯共此时’

#编码

print(s. encode (encoding='GBK'))

#在GBK这种编码格中一个中文占两个字节

print(s. encode (encoding='UTF-8'))

#在UTF-8这种编辑格式中，一个中文占三个字节

#解码

#byte代表就是一个二进制数据（字节类型的数据）

byte=s.encode(encoding='GBK') #编码

print (byte. decode (encoding=' GBK'))#解码