Python中的字符串

团子加油敲代码

已于 2022-03-05 18:31:53 修改

阅读量555

点赞数 1

分类专栏： Python基础文章标签： python 字符串

于 2021-01-11 16:26:09 首次发布

本文链接：https://blog.csdn.net/xiamuandsansan/article/details/112462091

版权

Python基础专栏收录该内容

15 篇文章 13 订阅

订阅专栏

字符串

1. 字符串的驻留机制

在Python中字符串是基本数据类型，是一个不可变的字符序列。

什么叫做字符串驻留机制呢？
仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量。
a=‘Python’
b=’‘Python’’
c=’’‘Python’’’

驻留机制的几种情况（交互模式）

字符串的长度为0或1时
符合标识符的字符串
字符串只在编译时进行驻留，而非运行时
[-5,256]之间的整数数字

C:\Users\Administrator>python
Python 3.9.1 (tags/v3.9.1:1e5d33e, Dec  7 2020, 17:08:21) [MSC v.1927 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> s1=''
>>> s2=''
>>> s1 is s2
True
>>> s1='%'
>>> s2='%'
>>> s1 is s2
True
>>> s1='abc%'
>>> s2='abc%'
>>> s1==s2
True
>>> s1 is s2
False
>>> id(s1)
2402989520816
>>> id(s2)
2402989520880
>>> s1='abcx'
>>> s2='abcx'
>>> s1 is s2
True
>>> a='abc'
>>> b='ab'+'c'
>>> c=''.join(['ab','c'])
>>> a is b
True
>>> a is c
False
>>> c
'abc'
>>> a=-5
>>> b=-5
>>> a is b
True
>>> a=-6
>>> b=-6
>>> a is b
False

sys中intern方法强制2个字符串指向同一个对象

>>> import sys
>>> a='abc%'
>>> b='abc%'
>>> a is b
False
>>> a=sys.intern(b)
>>> a is b
True

Pycharm对字符串进行了优化处理

a='abc%'
b='abc%'
print(a is b) #True

字符串驻留机制的优缺点：

当需要值相同的字符串时，可以直接从字符串池里拿来使用，避免频繁的创建和销毁，提升效率和节约内存，因此拼接字符串和修改字符串是会比较影响性能的。
在需要进行字符串拼接时建议使用str类型的join方法，而非+，因为join()方法是先计算出所有字符中的长度，然后再拷贝，只new一次，效率要比“+”效率高。

2. 字符串的常用操作

2.1 字符串的查询操作

功能	方法名称	作用
查询方法	index()	查找子串substr第一次出现的位置，如果查找的子串不存在时，则抛出ValueError
查询方法	rindex()	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则抛出ValueError
查询方法	find()	查找子串substr第一次出现的位置，如果查找的子串不存在时，则返回-1
查询方法	rfind()	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则返回-1

# 字符串的查询操作
s='hello,hello'
print(s.index('lo'))   # 3
print(s.find('lo'))    #3

print(s.rindex('lo'))  # 9
print(s.rfind('lo'))   # 9

# print(s.index('k')) 抛异常
print(s.find('k'))
# print(s.rindex('k')) 抛异常
print(s.rfind('k'))

2.2 字符串的大小写转换

功能	方法名称	作用
大小写转换	upper()	把字符串中所有字符都转成大写字母
	lower()	把字符串中所有字符都转成小写字母
	swapcase()	把字符串中所有大写字母都转成小写字母，把字符串中所有小写字母都转成大写字母
	captialize()	把第一个字符转换为大写，把其余字符转换为小写
	title()	把每个单词的第一个字符转换为大写，把每个单词的剩余字符转换为小写

# 字符串的大小写转换,将会产生新的字符串对象呢
s='hello,python'
a=s.upper()  #  转成大写之后，会产生一个新的字符串对象
print(s,id(s))
print(a,id(a))

b=s.lower()  #  #  转成小写写之后，会产生一个新的字符串对象
print(b,id(b))
print(s is b)

s2='hello,Python'
print(s2.swapcase())
print(s2.capitalize())
print(s2.title())

2.3 字符串内容对齐操作

功能	方法名称	作用
字符串对齐	center()	居中对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
	ljust()	左对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
	rjust()	右对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
	zfill()	右对齐，左边用0填充，该方法只接收一个参数，用于指定字符串的宽度，如果指定的宽度小于等于字符串的长度，返回字符串本身

# 字符串内容的对齐操作
s='hello,Python'
'''居中对齐'''
print(s.center(20,'*'))
print(s.center(20))     # 默认填充空格
'''左对齐'''
print(s.ljust(20,'*'))
print(s.ljust(10,'*'))  # 指定宽度小于字符串宽度时，按原字符串输出
'''右对齐'''
print(s.rjust(20,'*'))
print(s.rjust(20))
print(s.rjust(10,'*'))
print(s.zfill(20))  # 使用0进行填充，只能指定一个参数
print(s.zfill(10))
print('-8910'.zfill(8))

2.4 字符串的劈分

功能	方法名称	作用
字符串的劈分	spilt()	1. 从字符串的左边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表 2.以通过参数sep指定劈分字符串时的劈分符 3.通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次劈分之后，剩余的子串会单独作为一部分
字符串的劈分	rspilt()	1. 从字符串的右边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表 2.以通过参数sep指定劈分字符串时的劈分符 align=left>3.通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次劈分之后，剩余的子串会单独作为一部分

# 字符串的劈分操作
'''split() 从左侧开始劈分'''
s='hello world python'
lst=s.split()
print(lst)
s1='hello|world|python'
print(s1.split(sep='|'))
print(s1.split(sep='|',maxsplit=1))

'''rsplit() 从右侧开始劈分'''
print(s.rsplit())
print(s1.rsplit(sep='|'))
print(s1.rsplit(sep='|',maxsplit=1))

2.5 字符串判断的相关操作

功能	方法名称	作用
字符串判断	isidentifier()	判断指定的字符串是不是合法的标识符
	isspace()	判断指定的字符串是否全部由空白字符组成（回车、换行、水平制表符）
	isalpha()	判断指定的字符串是否全部由字母组成
	isdecimal()	判断指定的字符串是否全部由十进制的数字组成
	isnumeric()	判断指定的字符串是否全部由数字组成
	isalnum()	判断指定的字符串是否全部由字母和数字组成

# 判断字符串操作
'''判断指定的字符串是否是合法的标识符 isidentifier()'''
s='hello,python'
print('1',s.isidentifier())
print('2','hello'.isidentifier())
print('3','张三_'.isidentifier())
print('4','张三_123'.isidentifier())

'''判断指定的字符串是否全部由空白字符组成(回车、换行、水平制表符) isspace()'''
print('5','\t'.isspace())

'''判断指定的字符串是否全部由字母组成 isalpha()'''
print('6','bashbcsdh'.isalpha())
print('7','张三'.isalpha())
print('8','张三1'.isalpha())

'''判断指定的字符串是否全部由十进制的数字组成 isdecimal()'''
print('9','123'.isdecimal())
print('10','123四'.isdecimal())
print('11','Ⅱ'.isdecimal())

'''判断指定的字符串是否全部由数字组成 isnumeric()'''
print('12','123'.isnumeric())
print('13','123四'.isnumeric())  # True
print('14','Ⅱ'.isnumeric())   # True

'''判断指定的字符串是否全部由字母和数字组成 isalnum'''
print('15','abc1'.isalnum())
print('16','张三123'.isalnum())
print('17','123!'.isalnum())

2.6 字符串的替换与合并

功能	方法名称	作用
字符串替换	replace()	第1个参数指定被替换的子串，第2个参数指定替换子串的字符串，该方法返回替换后得到的字符串，替换前的字符串不发生变化，调用该方法时可以通过第3个参数指定最大替换次数
字符串的合并	join()	将列表或元组中的字符串合并成一个字符串

# 字符串的替换与合并
s='hello,Python'
print(s.replace('Python','Java'))
s1='hello,Python,Python,Python'
print(s1.replace('Python','Java',2))

lst=['hello','java','python']
print('|'.join(lst))
print(' '.join(lst))
t=('hello','java','python')
print('|'.join(t))
print('*'.join('Python'))

3. 字符串的比较

运算符：> , >= , < , <= , ==, !=
比较规则： 首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直达到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较。
比较原理： 两个以上字符进行比较时，比较的是其ordinal value（原始值），调用内置函数ord可以得到指定字符的 ordinal value。与内置函数ord对应的是内置函数chr，调用内置函数chr时指定的ordinal value可以得到其对应的字符。

# 字符串的比较操作
print('apple'>'app')  # True
print('apple'>'banana')
print(ord('a'))
print(ord('b'))
print(chr(97))
print(chr(98))
print(ord('乘'))

'''
==与is的区别：
==比较的是 value
is 比较的是id是否相等
'''
a=b='Python'
c='Python'
print(a==b)
print(a is b)
print(a is c)

4. 字符串的切片操作

字符串是不可变类型

不具备增、删、改等操作
切片操作将产生新的对象

# 字符串的切片操作
s='hello,Python'
s1=s[:5]    # 由于没有指定起始位置，所以从0开始切
s2=s[6:]    # 由于没有指定结束位置，所以切到字符串的最后一个元素
s3='!'
newstr=s1+s3+s2
print(newstr)
print('--------------------------------')
print(id(s))
print(id(s1))
print(id(s2))
print(id(s3))
print(id(newstr))

print('---------------切片[start:stop:step]-----------------')
print(s[1:5:1])  # 从1开始切到5（不包括5），步长为1
print(s[::2])    # 默认从0开始，默认到字符串的最后一个元素，步长为2
print(s[::-1])   # 默认从字符串的最后一个元素开始，到第一个元素结束，因为步长为负数
print(s[-6::1])  # 从索引-6开始，到字符串的最后一个元素结束，步长为1

5. 格式化字符串

按一定格式输出的字符串。
格式化字符串的两种方式：

%作占位符

在这里插入图片描述

{}作占位符

# 格式化字符串
'''% 占位符'''
name='张三'
age=20
print('我叫%s,今年%d岁。'%(name,age))

'''{} 占位符'''
print('我的名字叫：{0}，今年{1}岁了，我真的叫{0}。'.format(name,age))

'''f-string'''
print(f'我叫{name},今年{age}岁。')

print('%10d' %99)  # 10 表示的是宽度
print('%f'% 3.1415926)
print('%.3f'% 3.1415926) # 保留3位小数
print('%10.3f'% 3.1415926) # 同时表示宽度和精度  总宽度为10，小数点保留3位

print('{0}'.format(3.1415926))
print('{0:.3}'.format(3.1415926))     # 一共是三位数
print('{0:.3f}'.format(3.1415926))    # 保留三位小数
print('{0:10.3f}'.format(3.1415926))  # 同时表示宽度和精度  总宽度为10，小数点保留3位

6. 字符串的编码转换

为什么需要字符串的编码转换？
在这里插入图片描述
编码与解码的方式：

编码： 将字符串转换为二进制数据（bytes）
解码： 将bytes类型的数据转换成字符串类型

# 字符串的编码转换
'''编码'''
s='天涯共此时'
print(s.encode(encoding='GBK')) # 在GBK这种编码格式中：一个中文占2个字节
print(s.encode(encoding='UTF-8'))  # 在UTF-8这种编码格式中：一个中文占3个字节

'''解码'''
# byte代表一个二进制数据（字节类型的数据）
byte=s.encode(encoding='GBK') # 编码
print(byte.decode(encoding='GBK'))  # 解码

byte=s.encode(encoding='UTF-8') # 编码
print(byte.decode(encoding='UTF-8'))  # 解码

# 注意：编码与解码格式要相同

团子加油敲代码

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python中的字符串

目录字符串1. 字符串的驻留机制2. 字符串的常用操作2.1 字符串的查询操作2.2 字符串的大小写转换2.3 字符串内容对齐操作2.4 字符串的劈分2.5 字符串判断的相关操作2.6 字符串的替换与合并3. 字符串的比较4. 字符串的切片操作5. 格式化字符串6. 字符串的编码转换字符串1. 字符串的驻留机制在Python中字符串是基本数据类型，是一个不可变的字符序列。什么叫做字符串驻留机制呢？仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的
复制链接

扫一扫