python--字符串）-CSDN博客

本文链接：https://blog.csdn.net/m0_73622195/article/details/133715597

python基础–字符串

字符串

概念及特点

包含那零个或者多个字符的有序不可变序列

特点：

有序性：添加顺序和显示顺序一致，添加字符的适合，会设置编号，编号是从0 开始的，被称为索引、下标、角标【有索引、有切片】

不可变性：在内存地址不变的情况下，字符串的内容不允许发生变化

如果字符串内容发生变化,内存地址一定发生变化

定义字符串

1.使用引号【一对单引号，一对双引号，一对三引号[预编译文本保持内容的原样输出]】

2.使用str()构造

索引和切片

索引

通过索引获取对于的字符

操作：字符串[索引]

索引分为两种:正向，负向

正向索引
	从左向右数
	从0开始 到长度-1结束
负向索引
	从右向左数
	从-1开始 到-长度结束

s = '床前明月光，疑是地上霜。'
print(s,len(s)) # 床前明月光，疑是地上霜。 12
print(s[0]) # 床
print(s[9]) # 上
print(s[len(s)-1]) # 。

切片

操作：字符串[起始索引：结束索引：步长] 特点：不包含结束位置

切片时根据索引来定位范围，获取范围中的子串
根据步长的正负性，分两种：
	正向切片 ：从左向右获取，步长为正
		要求： 起始索引定位的字符要在结束索引定位的字符的左边（起始小于结束）
	负向切片 ：从右向左获取，步长为负
		要求：起始索引定位的字符在结束索引定位的字符的右边
有些内容可以省略
	1.省略：步长-----字符串[起始索引：结束索引]：表示步长为1，从左向右逐步获取
	2.省略起始索引-----字符串[：结束索引：步长]
		步长为正 ：从左向右获取，表示从最左边开始
		步长为负 ：从右向左获取，表示从最右边开始
	3.省略结束索引----字符串[起始索引：：步长]
		步长为正 ：从左向右获取，表示到最右边结束
		步长为负 ：从右向左获取，表示到最左边结束
	4.同时省略多个

遍历字符串

直接遍历字符串

s = 'GJHUHBhjhyhu%^%*(&9g'
# 获取s中大写的英文字母的个数
c = 0
for i in s:
    if 'A' <= i <='Z':
        c += 1
print(c)

# 获取26个大写英文字母
print(string.ascii_uppercase) # ABCDEFGHIJKLMNOPQRSTUVWXYZ
# 获取26个小写英文字母
print(string.ascii_lowercase) # abcdefghijklmnopqrstuvwxyz
#  获取所有大小写字母
print(string.ascii_letters) # abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
# 获取所有数字
print(string.digits) # 0123456789

 # 使用其他方法判断是否是大写
c = 0
for i in s:
    # string.ascii_uppercase 获取26个大写英文字母
    if i in string.ascii_uppercase:
        c += 1
print(c)

遍历索引【应用场景：条件或者结论中和索引相关】

s = 'GJHUHBhjhyhu%^%*(&9g'
# 获取大写英文字母对应的索引
for i in range(0,len(s)):
    # 获取索引对应的字母，判断是否是大写
    if s[i] in string.ascii_uppercase:
        print(i,end=' ') # 0 1 2 3 4 5

# 获取索引能被3或者4整除对应的字符
for j in range(len(s)):
    if j%3 == 0 or j%4 == 0 :
        print(s[j],end=' ') # G U H h h y % * ( 9

枚举遍历【最好用】enumerate()

可以同时获取索引和对应的字符

s = 'GJHUHBhjhyhu%^%*(&9g'
for i in enumerate(s):
    print(i) # i 是一个元组 ，第一个内容是索引，第二个是索引对应的字符

s = 'GJHUHBhjhyhu%^%*(&9g'
# 相当于拆包，pos代表索引，ele代表字符
for pos,ele in enumerate(s):
    print(pos,ele)

s = 'GJHUHBhjhyhu%^%*(&9g'
for pos,ele in enumerate(s):
    # 直接判断字符
    if ele in string.ascii_uppercase:
        # 直接输出索引
        print(pos)

转义字符串

\对一些符号进行转义

\n---newline 换行操作 将光标定位到下一行的值
\t---tab 横向制表符
\r---return  如果\r之前有内容，先把内容删除再写后面的内容
\v  -- 纵向制表符 
\f  -- 翻页 
\u  -- unicode编码   win系统   c:\user
\' -- '
\" -- "
\\ -- \

字符串的获取

# 获取子串再字符串中第一次出现的位置
# 1.字符串对象.find(子串，起始索引，结束索引)
s = 'abcabcabc'
print(s.find('abc')) # 0
print(s.find('abc',1,)) # 3
print(s.find('abc',1,6)) # 3

#2.字符串对象.index(子串，起始索引，结束索引)
print(s.index('abc')) # 0
print(s.index('abc',1)) # 3

# 获取子串再字符串中最后一次出现的位置
# 1.字符串对象.rfind(字符串，起始索引，结束索引)
print(s.rfind('abc')) # 6

# 获取某个子串再字符串中出现的次数
print(s.count('abc')) # 3
s1 = 'ababababababab'
# 注意： 记得不是重叠的
print(s1.count('abab')) # 3

字符串的判断操作

判断是否是纯数字组成  .isdigit()
s1 = 'dfghj123'
s2 = '23456789'
print(s1.isdigit()) # False
print(s2.isdigit()) # True

判断是否是纯字母组成  .isalpha()  注意： 字母不仅指英文字母
s1 = '你好'
s2 = 'sadsc1232'
print(s1.isalpha()) # True
print(s2.isalpha()) # False

判断是否是纯数字或者纯字母  .isalnum() 注意；字母不仅指英文字母
# 结果为Ture 三种情况：纯数字、纯字母、数字+字母
s1 = '123'
s2 = 'sadsc'
s3 = 'wfwwfd1234'
print(s1.isalnum()) # True
print(s2.isalnum()) # True
print(s3.isalnum()) # True

判断字符串中的英文字母是否都是大写  .isupper()
s1 = '你好123abcASDJ'
s2 = '你好123ANJJ'
print(s1.isupper()) # False
print(s2.isupper()) # True（值判断英文字母，不管其他字符）

判断字符串中的英文字母是否都是小写   .islower()
s1 = '你好123abcASDJ'
s2 = '你好123dfgh'
print(s1.islower()) # False
print(s2.islower()) # True

# 判断内字符串中的内容是否都来源与ASCII表  .iaascii()
print(s1.isascii()) # False

# 判断是否首字母大写其他小写  .istitle()
s1 = 'How Are You'
print(s1.istitle())  # True

# 判断是否以指定内容开头  .startswith(指定内容)
print(s1.startswith('How')) # True

#判断字符串是否以多个内容中的一个开头
s1.startswith(('ow','Ar','Y')) # True

# 判断字符串是否以指定内容结尾  .endswith(指定内容)
print(s1.endswith('ou'))  # True

# 判断字符串是否以对各内容中的其中一个结尾
print(s1.endswith(('re', 'ou'))) # True

编码和解码

# 编码方式
# gbk  汉字的编码，占2个字节
# utf-8  汉字的编码，占3个字节

#1.字符串的编码 ---字符窜对象.encode(编码方式)
s = '你好'
utf_s = s.encode('utf-8')
print(utf_s) # b'\xe4\xbd\xa0\xe5\xa5\xbd'

gbk_s = s.encode('gbk')
print(gbk_s) # b'\xc4\xe3\xba\xc3'

# 2.字符串的解码 ---字符串对象.decode(解码方式)
# 注意：用什么方式编码就用什么方式解码，否则会乱码挥着报错
print(utf_s.decode('utf-8')) # 你好
print(utf_s.decode('gbk')) # 浣犲ソ
print(gbk_s.decode('gbk')) # 你好
# 特点：对于ASCII中的符号，编码前后内容不变

# 判断字符串是否是纯英文组成
# 思路：先编码再判断
s1 = '你好abichj'
print(s1.encode('gbk').isalpha())
s2 = 'asdf'
print(s2.encode('gbk').isalpha())

# 判断字符串是否为数字或字母
# 思路：先编码再判断
print(s1.encode('gbk').isalnum())
print(s2.encode('gbk').isalnum())

# 判断是否是字母和数字
# 思路：数字或字母：纯数字、纯字母、数字和字母
s = 'ghjk1234'
print(s.isalnum() and not (s.isdigit()) and not (s.isalpha())) # True

字符串的转换

# 小写字母转化为大写  .upper()
s = 'How aRe yOu'
print(s.upper()) # HOW ARE YOU

# 大写转换为小写  .lower()
print(s.lower()) # how are you

# 大写转化为小写，小写转换为大写  .swapcase()
print(s.swapcase()) # hOW ArE YoU

# 首字母大写，其他字母小写  .capitalize()
print(s.capitalize()) # How are you

# 将每个单词的首字母大写，其他字母小写    .title()
print(s.title()) # How Are You