字符串
什么是字符串(str)
""" 容器型数据类型:将''或者""或者''''''或者""""""作为容器标志,引号中的每个符号就是字符串的元素 (''''''和""""""在表示字符串内容的时候可以不使用转义字符,而是直接回车) 字符串不可变(不支持增删改);字符串有序(支持下标) 元素: 引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以是任何符号 字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义) """
字符串的元素 - 字符
# 空串 -- str1 = '' """ 字符分为普通字符和转义字符两种 转移字符 - 在特定符号前加\让符号具备特殊功能,常用转移字符如下: \n - 换行 \t - 水平制表符(相当于tab键的功能) \' - 表示一个普通的单引号 \" - 表示一个普通的双引号 \\ - 表示一个普通反斜杠 一个转义字符的长度是1 """ # \u4位的字符编码值 - 编码字符
字符编码
""" 1.编码 计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中。 为了能够让计算机具备存储文字符号的能力。我们给所有的文字符号对应了一个固定的数据,每次要存储符号的 时候就把符号对应的数字存起来,符号对应的数字就是符号的编码值 2.编码表 - 保存符号和数字对应关系的表 1) ASCII码表 a.总共有128个字符(美国符号) b.数字在字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有其他符号 2) Unicode编码表(Python) a.对ASCII码表的扩展,包含了世界上所有的民族所有语音的符号(又称万国码),总共65536个 b.中文范围: 4e00 ~ 9fa5 3) 编码值在Python中的使用 a.chr函数: chr(编码值) - 获取编码值对应的字符 b.ord函数: ord(字符) - 获取字符的编码值 c.编码字符: \u4e00(4e00就是一个16进制的编码字符) 注意: python中需要字符的地方都必须使用长度为1的字符 """
字符串相关操作
查 - 获取字符串的字符 字符串获取字符的语法和列表获取元素的语法一样
数学运算符 + *
比较运算
- 比较是否相等 *** print(‘abc’ == ‘abc’) # True***
- 比较大小 两个字符比较大小,比较的是第一对不相等的字符的编码值大小
""" char = ? 判断是否是数字字符: '0' <= char <= '9' 判断是否是小写字母: 'a' <= char <= 'z' 判断是否是大写字母: 'A' <= char <= 'Z' 判断是否是字母 : 'a' <= char <= 'z' or 'A' <= char <= 'Z' 判断是否是中文 : '\u4e00' <= char <= '\u9fa5' """
in 和 not in 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
r语法 (r-string) - 在字符串的前面加r/R — 阻止转义
相关函数
""" len(字符串) str(数据) - 将数据转换成字符串 (任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号) eval(字符串) - 去掉字符串的引号,获取数据(如果是表达式就计算结果) """
字符串的相关方法
# 1. join # 字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串 list1 = ['abc', 'name', '123', 'sdf'] result = ''.join(list1) print(result) # abcname123sdf # 2. count # 字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数 message = 'how are you? i am fine! thank you! and you?' result5 = message.count('you') print(result5) # 3 # 3. index/find # 字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值) # 字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值) # 在字符串2不存在的时候index会报错,find会不报错并且返回-1 # rindex/rfind - 是从右往左找,找到的是最后一个字符串2 result6 = message.index('you') print(result6) # 8 # 4.split # 字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割 # 字符串1.split(字符串2, N) - 最多切N次 # 注意:如果切割点怎么分布,切完后小字符串的个数都是切割点的数量加1 # 5.replace # 字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3 # 字符串1.replace(字符串2, 字符串3, N) - 只替换前N个 # 6. center\rjust\ljust\zfill # 字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居中显示 # 字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居右显示 # 字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居左显示 # 字符串1.zfill(长度) == 字符串1.rjust(长度, '0') # 7.strip/rstrip/lstrip 爬虫 # strip - 同时去掉字符串两边的所有的空白 # rstrip - 去掉字符串右边的所有空白 # lstrip - 去掉字符串左边的所有空白
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
str1 = input('请输入:') new_str1 = '' for x in str1[1::2]: new_str1 += x print(new_str1)
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
user1 = input('请输入用户名:') if 6 <= len(user1) <= 10: print('合法') else: print('不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
user2 = input('请输入用户名:') for x in user2: if '0' <= x <= '9' or 'a' <= x <= 'z': continue else: print('不合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
user3 = input('请输入用户名:') if 'A' <= user3[0] <= 'Z': for x in user3[1:]: if '0' <= x <= '9' or 'a' <= x <= 'z': continue print('合法') else: print('不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
input1 = input('请输入:') new_input1 = '' for x in input1: if '0' <= x <= '9': new_input1 += x print(new_input1)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
print(input2.upper()) input2 = input('请输入:') input3 = '' for x in input2: if 'a' <= x <= 'z': input3 += chr(ord(x)-32) else: input3 += x print(input3)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
num = input('输入一个小于1000的数字:') print('py1901', num.rjust(3, '0'), sep='')
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
count = 0 input8 = input('输入一个字符串:') for x in input8: if not ('0' <= x <= '9' or 'a' <= x <= 'z'): count += 1 print('非数字字母的字符的个数', count)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
input9 = input('输入字符串:') len1 = len(input9) new_input9 = '' for num in input9[1:len1-1]: new_input9 += num print(new_input9.center(len1, '+'))
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
inp10 = input('输入字符串')
len1 = len(inp10)
if len1 % 2:
print(inp10[len1//2])
else:
index = len1 // 2
print(inp10[index - 1], inp10[index])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str3 = 'abc123'
str4 = 'huak3'
str5 =''
for x in str3:
if x in str4:
str5 += x
print(str5)