Python学习.第八天.字符串

最新推荐文章于 2024-07-17 21:04:45 发布

燃想去看大海

最新推荐文章于 2024-07-17 21:04:45 发布

阅读量145

点赞数

文章标签： python 学习开发语言

本文链接：https://blog.csdn.net/aaaa_fan/article/details/125004451

版权

Python学习.第八天.字符串

前言
一、字符串的创建和驻留机制
二、字符串的常用操作
三、字符串的比较
四、字符串的切片操作
五、格式化字符串
六、字符串的编码转换
总结

前言

我看了 != 我会了

一、字符串的创建和驻留机制

在Python中字符串是基本类型数据，是一个不可变的字符序列。
字符串驻留机制是仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量。
不可变序列：元组字符串

a = 'Python'
b = "Python"
c = '''Python'''
print(a, id(a))
print(b, id(b))
print(c, id(c))

在这里插入图片描述
a b c 的id相同，指向同一块的内存空间，这就是字符串的驻留机制，仅保存一份相同且不可变字符串的方法。

什么样的字符串会有驻留机制？
驻留机制的几种情况（交互模式 cmd）：
（1）字符串的长度为0或1时，字符串小于1时，才会触发驻留机制。
（2）符合标识符的字符串：字符、数字、下划线
（3）字符串旨在编译时进行驻留，而非运行时
（4）[-5,256]之间的整数数字

sys中的intern方法强制2个字符串指向同一个对象
PyCharm对字符串进行了优化处理。

字符串驻留机制的优缺点
(1) 当需要值相同的字符串时，可以直接从字符串池里拿来使用，避免频繁的创建和销毁，提升效率和节约内存，因此拼接字符串和修改字符串是会比较影响性能的。
(2)需要进行字符串拼接时建议使用str类型的join方法，而非+，因为join()方法是先计算出所有字符中的长度，然后再拷贝，只new一次对象，效率要比"+"效率高。

二、字符串的常用操作

1、字符串的查询操作

（1）index()：查找子串substr第一次出现的位置,如果查找的子串不存在时，则抛出ValueError
（2）rindex()：查找子串substr最后一次出现的位置，如果查找的子串不存在时，则抛出ValueErrorfind()
（3）find()：查找子串substr第一次出现的位置,如果查找的子串不存在时，则返回-1
（4）rfind()：查找子串substr最后一次出现的位置,如果查找的子串不存在时，则返回-1

# KMP匹配？？？
a = 'Python，Python'
print(len(a))
print(a.index('o'))
print(a.rindex('o'))
print(a.find('o'))
print(a.rfind('o'))

2、字符串的大小写转换操作方法

（1）upper()：把字符串中所有字符都转成大写字母
（2）lower()：把字符串中所有字符都转成小写字母
（3）swapcase()：把字符串中所有大写字母转成小写字母，把所有小写字母都转成大写字母
（4）capitalize()：把第一个字符转换为大写，把其余字符转换为小写
（5）title()：把每个单词的第一个字符转换为大写，把每个单词的剩余字符转换为小写

s = 'how do you like write python ?'
print(s.upper())  # 转换之后，会产生一个新的字符串对象
print(s.lower())  # 转换之后，会产生一个新的字符串对象
print(s.swapcase())
print(s.capitalize())
print(s.title())

在这里插入图片描述

3、字符串内容对齐操作

（1）center()：居中对齐，第1个参数指定宽度，第2个参数指定填充符,第2个参数是可选的，默认是空格,如果设置宽度小于实际宽度，则返回原字符串
（2）ljust()：左对齐，第1个参数指定宽度，第2个参数指定填充符,第2个参数是可选的，默认是空格如果设置宽度小于实际宽度则则返回原字符串
（3）rjust()：右对齐,第1个参数指定宽度，第2个参数指定填充符,第2个参数是可选的，默认是空格如果设置宽度小于实际宽度则则返回原字符串
（4）zfill()：右对齐，左边用0填充,该方法只接收一个参数，用于指定字符串的宽度，如果指定的宽度小于等于字符串的长度，返回字符串本身

s = 'hello,Python'
print(len(s))  # 字符宽度为12
print(s.center(20, '*'))  # 给定20个宽度的位置，左右各填充四，使字符串居中

print(s.ljust(20, '*'))
print(s.ljust(10))  # 如果原字符超过了给定的字符长度，则返回原字符

print(s.rjust(20,'*'))
print(s.rjust(20))

print(s.zfill(20))
print(s.zfill(10))
print('-8910'.zfill(8))  # 补0操作

在这里插入图片描述

4、字符串劈分操作

（1）split()：从字符串的左边开始劈分，默认的劈分字符是空格字符串,返回的值都是一个列表，以通过参数sep指定劈分字符串是的劈分符，通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次劈分之后，剩余的子串会单独做为一部分
（2）rsplit()：从字符串的右边开始劈分，默认的劈分字符是空格字符串,返回的值都是一个列表以通过参数sep指定劈分字符串是的劈分符，通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次劈分之后，剩余的子串会单独做为一部分。

s = 'how do you like write python ?'
lst = s.split()  # 默认分隔符为空格
print(lst)
s1 = 'how do you like write python ?'
# print(s1.split(sep=' ', maxsplit=2))  # 从左侧开始分割
print(s1.split(' ', 3))  # 可以不用写sep和maxsplit

print(s.rsplit())  # 从右侧开始分割
print(s.rsplit(' ', 3))

在这里插入图片描述

5、判断字符串的操作

（1）isidentifier()：判断指定的字符串是不是合法的标识符
（2）isspace()：判断指定的字符串是否全部由空白字符组成(回车、换行，水平制表符)
（3）isalpha()：判断指定的字符串是否全部由字母组成
（4）isdecimal()：判断指定字符串是否全部由十进制的数字组成
（5）isnumeric()：判断指定的字符串是否全部由数字组成
（6）isalnum()：判断指定字符串是否全部由字母和数字组成

print('hello'.isidentifier())  # True
print('张三'.isidentifier())  # 张三为什么时合法的？ 张三是字符，所以合法 # True
print('张三,123'.isidentifier())  # False
print(' '.isspace())  # True
print('123张三'.isalpha())  # False
print('张三'.isalpha())  # True
print('123'.isdecimal())  # True
print('1234910'.isnumeric())  # True
print('123wf'.isalnum())  # True
print('123_wf'.isalnum())  # False

6、字符串的替换与合并操作

（1）replace()：第1个参数指定被替换的子串，第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串，替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数
（2）join()：将列表或元组中的字符串合并成一个字符串

s = 'hello,python'
print(s.replace('python', 'Java'))
s = 'hello,python,python,python'
print(s.replace('python', 'Java', 2))

s1 = ['hello', 'python', 'java']
print('|'.join(s1))

print('*'.join('python'))

在这里插入图片描述

三、字符串的比较

运算符:>,>=,<,<=,==,!=
（1）比较规则:首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较
正在缓
公
（2）比较原理:两上字符进行比较时，比较的是其ordinal value(原始值),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符

在这里插入代码片

四、字符串的切片操作

字符串是不可变类型，不具备增、删、改等操作，切片操作将产生新的对象。

str = 'hello,python'
s1 = str[:5]  # 由于没有指定起始位置，所以从0开始  [start:stop:step]
s2 = str[6:]  # 由于没有指定结束位置，所以到字符串最后
s3 = '!'
newstr = s1 + s3 + s2
print(str, id(str))  # 原串
print(newstr, id(newstr))  # 新串
print(id(s1))
print(id(s2))
print(id(s3))

# 复习
print(str[::-1])  # 默认从字符串的最后一个元素开始，到字符串的第一个元素结束，因为步长是负数
print(str[-6::1])  # 索引从-6开始，到字符串的最后一个元素结束，步长为1

在这里插入图片描述

五、格式化字符串

格式化字符串的两种方式
（1）%作占位符：

定义的格式化字符串
我的名字叫：%s，今年%d岁了
%是固定符号（name，age）分别是（实际值，实际值）

（2）{}作占位符：
我的名字叫:{0}，今年{1}岁了，我真的叫:{0}.format(name，age)

name = '张三'
age = 20
print('我叫%s,今年%d岁' % (name, age))  # 第一种
print('我叫{0},今年{1}岁'.format(name, age))  # 第二种 0 1 分别指的是name和age的位置
print(f'我叫{name},今年{age}岁')  # 第三种

在这里插入图片描述
（3）字符串精度和宽度的控制

# 精度和宽度的控制
print('%10d' % 99)
print('%.3f' % 3.1415926)
print('%10.3f' % 3.1415926)

print('{0:.3}'.format(3.1415926))  # .3表示一共3位数
print('{0:.3f}'.format(3.1415926))  # .3f表示一共3位小数
print('{:10.3f}'.format(3.1415926))  # 同时设定宽度和精度

在这里插入图片描述

六、字符串的编码转换

A计算机中，str在内存以unicode表示，编码之后通过byte字节传输，再解码到B计算机中显示。
编码：将字符串转换为二进制数据（bytes）
解码：将bytes类型的数据转换成字符串

s= '天涯共此时'
print(s.encode(encoding='GBK'))  # GBK中，一个中文站两个字节
print(s.encode(encoding='UTF-8'))  # GBK中，一个中文站三个字节

byte = s.encode(encoding='GBK')
print(byte.decode(encoding='GBK'))

byte1 = s.encode(encoding='UTF-8')
print(byte1.decode(encoding='UTF-8'))

在这里插入图片描述

总结

现在只要坚持下去就好了！

燃想去看大海

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python学习.第八天.字符串

Python学习.第八天.字符串前言一、字符串的驻留机制二、字符串的常用操作二、字符串的比较二、字符串的切片操作二、格式化字符串二、字符串的编码转换1.引入库2.读入数据总结前言一、字符串的驻留机制在Python中字符串是基本类型数据，是一个不可变的字符序列。字符串驻留机制是仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，二十把该字符串的地址赋给新创建的变量。二、字符串的常用操作二
复制链接

扫一扫