python字符串的驻留机制、字符串的常用操作（查询、大小写转换、对齐、劈分分割、判断、替换）、比较、切片、格式化、编码和解码

外咸瓜街的一条咸鱼

已于 2022-05-10 15:02:14 修改

阅读量1.2k

点赞数

分类专栏： python 文章标签： python 开发语言

于 2022-05-02 15:52:00 首次发布

本文链接：https://blog.csdn.net/hmysn/article/details/124541949

版权

python 专栏收录该内容

24 篇文章 0 订阅

订阅专栏

字符串
在Python中字符串是基本数据类型，是一个不可变的字符序列

一、字符串的驻留机制：
因为python中万物皆对象，对象的生成需要消耗时间，销毁也需要时间，所以为了节约时间，python使用了字符串驻留机制：
这是一种仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量
简单来说就是相同内容的字符串放置在同一个地址id，再次生成变量时不会浪费这个时间再去生成新对象。

在cmd或者idea中去运行字符串进行判断，有以下驻留机制的几种情况(交互模式)
1、字符串的长度为0或1时
2、符合标识符的字符串
3、字符串只在编译时进行驻留，而非运行时
4、[-5,256]之间的整数数字

但是在pycharm中对字符串进行了优化处理，所有相同的内容都会被视作是一个id
以下代码大家可以去拿去实验一下，在pycharm中为true，在cmd中为false

s1='abc%'
s2='abc%'
print(s1 is s2)

二、字符串的常用操作之查询：（index、find）

s='hello,hello'
print(s.index('lo')) #3
print(s.find('lo'))#3
print(s.rindex('lo')) #9
print(s.rfind('lo'))#9

#print(s.index('k')) #ValueError: substring not found
print(s.find('k'))  #-1
#print(s.rindex('k')) #ValueError: substring not found
print(s.rfind('k')) #-1

这边index如果查询不到会报错，但是find会返回-1，所以推荐使用find查询。

三、字符串常用操作之大小写转换操作。

s='hello,python'
a=s.upper()  #转成大写之后，会产生一个新的字符串对象
print(a,id(a))
print(s,id(s))
b=s.lower()  #转换之后，会产生一个新的字符串对象
print(b,id(b))
print(s,id(s))
print(b==s)
print(b is s) #False

s2='hello,Python'
print(s2.swapcase())

print(s2.title())

四、字符串常用操作之内容对其操作方式：

s='hello,Python'
'''居中对齐'''
print(s.center(20,'*'))

'''左对齐'''
print(s.ljust(20,'*'))
print(s.ljust(10))
print(s.ljust(20))

'''右对齐'''
print(s.rjust(20,'*'))
print(s.rjust(20))
print(s.rjust(10))

'''右对齐，使用0进行填充'''
print(s.zfill(20))
print(s.zfill(10))
print('-8910'.zfill(8))

五、字符串常用操作之劈分：
将字符串通过一定的标识符分割成几个字符串储存在列表中。

s='hello world Python'
lst=s.split()
print(lst)
s1='hello|world|Python'
print(s1.split(sep='|'))
print(s1.split(sep='|',maxsplit=1))
print('-------------------------------')
'''rsplit()从右侧开始劈分'''
print(s.rsplit())
print(s1.rsplit('|'))
print(s1.rsplit(sep='|',maxsplit=1))

六、字符串判断：

s='hello,python'
print('1.',s.isidentifier()) #False
print('2.','hello'.isidentifier()) #True
print('3.','张三_'.isidentifier()) #True
print('4.','张三_123'.isidentifier()) #True

print('5.','\t'.isspace()) #True

print('6.','abc'.isalpha()) #True
print('7.','张三'.isalpha()) #True
print('8.','张三1'.isalpha()) #False

print('9.','123'.isdecimal()) #True
print('10.','123四'.isdecimal()) # False
print('11.','ⅡⅡⅡ'.isdecimal()) # False

print('12.','123'.isnumeric()) #True
print('13.','123四'.isnumeric())#True
print('14.','ⅡⅡⅡ'.isnumeric()) #True

print('15.','abc1'.isalnum()) #True
print('16.','张三123'.isalnum()) #True
print('17.','abc!'.isalnum()) #False

七、字符串的替换合并

s='hello,Python'
print(s.replace('Python','Java'))
s1='hello,Python,Python,Python'
print(s1.replace('Python','Java',2))


lst=['hello','java','Python']
print('|'.join(lst))
print(''.join(lst))

t=('hello','Java','Python')
print(''.join(t))

print('*'.join('Python'))

八、字符串的比较：
字符串的比较操作
运算符:>,>=,<,<=,==,!=

比较规则:首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较

比较原理:两上字符进行比较时，比较的是其ordinal value(原始值),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr，调用内置函数chr时指定ordinal value可以得到其对应的字符

print('apple'>'app') #True
print('apple'>'banana') #False   ，相当于97>98 >False
print(ord('a'),ord('b'))
print(ord('杨'))

print(chr(97),chr(98))
print(chr(26472))

'''== 与is的区别
  == 比较的是 value
  is  比较的是id是否相等'''
a=b='Python'
c='Python'
print(a==b)  #True
print(b==c)  #True

print(a is b)  #True
print(a is c ) #True
print(id(a)) #2204259933168
print(id(b)) #2204259933168
print(id(c)) #2204259933168

九、字符串的切片：
字符串是不可变类型不具备增、删、改等操作切片操作将产生新的对象。

print('------------------切片[start:end:step]-------------------------')
print(s[1:5:1])   #从1开始截到5（不包含5），步长为1
print(s[::2])  #默认从0 开始，没有写结束，默认到字符串的最后一个元素 ,步长为2  ，两个元素之间的索引间隔为2
print(s[::-1]) #默认从字符串的最后一个元素开始，到字符串的第一个元素结束，因为步长为负数
print(s[-6::1]) # 从索引为-6开始，到字符串的最后一个元素结束，步长为1

九、格式化字符串：

#(1) % 占位符
name='张三'
age=20
print('我叫%s,今年%d岁' % (name,age))

#(2) {}
print('我叫{0},今年{1}岁'.format(name,age))

#(3)f-string
print(f'我叫{name},今年{age}岁')

小数的格式化：

print('{0:.3}'.format(3.1415926))  #.3表示的是一共是3位数

print('{:.3f}'.format(3.1415926)) #.3f表示是3位小数

print('{:10.3f}'.format(3.1415926))  #同时设置宽度和精度，一共是10位，3位是小数

十、字符串的编码转换：
一些爬虫的预备知识，先了解一下：

s='天涯共此时'
#编码
print(s.encode(encoding='GBK'))  #在GBK这种编码格中 一个中文占两个字节
print(s.encode(encoding='UTF-8')) #在UTF-8这种编辑格式中，一个中文占三个字节

#解码
#byte代表就是一个二进制数据（字节类型的数据）
byte=s.encode(encoding='GBK')   #编码
print(byte.decode(encoding='GBK')) #解码

byte=s.encode(encoding='UTF-8')
print(byte.decode(encoding='UTF-8'))

外咸瓜街的一条咸鱼

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
python字符串的驻留机制、字符串的常用操作（查询、大小写转换、对齐、劈分分割、判断、替换）、比较、切片、格式化、编码和解码

字符串在Python中字符串是基本数据类型，是一个不可变的字符序列一、字符串的驻留机制：因为python中万物皆对象，对象的生成需要消耗时间，销毁也需要时间，所以为了节约时间，python使用了字符串驻留机制：这是一种仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量简单来说就是相同内容的字符串放置在同一个地址id，再次生成变量时不会浪费这个时间再去.
复制链接

扫一扫