python字符串
1.字符串和字符
1.1 什么是字符串(str)
容器型数据类型;将’‘或者""或者’’’’’‘或者""""""作为容器标志,引号中每个符号就是字符串的元素
(’’’’’'和""""""在表示字符串的时候换行可以不使用转义字符,而是直接回车)
字符串不可变(不支持增删改):字符串有序(支持下标操作)
元素:引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以是任何符号。
字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)
str1 = '90,100'
str2 = "ksd585+==_$%^"
str3 = 'abc\n123'
str4 = '''adc
123'''
1.2 字符串的元素 - 字符
字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加/反斜杠 让符号具备特殊的功能,常用转义字符如下:
- \n - 换行
- \t - 水平制表符(相当于tab键的功能)
- \’ - 表示一个普通的单引号
- \" - 表示一个普通的双引号
- \\ - 表示一个普通的反斜杠
一个转义符的长度是1
str7 = '\tabc\n123'
print(str7)
str8 = 'it\'s me!'
str9 = "it's me!"
print(str8)
print(str9)
str10='I say:"holle"'
print(str10)
str11 = 'abc\\name'
print(str11)
1.3 字符编码
编码
计算机只能自己存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的
为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应的一个固定的数字,每次要存储符号的时候就把符号对应的数字存起来
符号对应的数字就是符号的编码值
编码表 - 保存符号和数字对应关系的表
ASCII码表
a.总共有128个字符(美国符号)
b.数字在字母的前面,大写字母在小写字母前面;大写字母和小写字母之间有其他符号
Unicode编码表(python)
a.Unicode编码表是对ASCII表的扩展,包含了世界上所有的民族的语言
b.中文范围:4e00-9fa5
编码值在Python中的应用
a. chr函数:chr(编码值) - 获取编码值对应的字符
b. ord函数:ord(字符) - 获取字符的编码
c. 编码字符:\u4e00(4e00就是一个16进账的编码值)
注意:Python中需要字符的地方都必须使用长度为1的字符串赋值
print(chr(97))
print(chr(36),chr(0x23))
print(chr(0x4e00))
print(chr(0x8123))
num=0
for x in range(0x4dc0,0x4dff):
print(chr(x),end='')
num +=1
if num%30==0:
print()
str13 = ''
print(type(str13),len(str13)) # <class 'str'> 0
print(ord('陈'),ord('益'),ord('锋'))
c = 'M'
new_c=chr(ord(c)+32)
print(new_c)
str14 = 'abc\u5ff5'
print(str14)
2 字符串相关操作
2.1 查-获取字符串的字符
字符串取字符的语法和列表获取元素的方法一样
str1 = '\tabc\n123\'+-0'
print(str1[1])
print(str1[-1])
print(str1[5:8])
print(str1[1:])
print(str1[::-1])
for x in str1:
print(x)
2.2 数学运算符:+、*
print('hello' + 'world!')
print('hello' * 2)
# 练习:提取字符中小写字母
# 'ss试试看78,mvn0-k=上课23' -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
if 97 <= ord(x) <= 122:
new_str2 += x
print(new_str2)
new_str2 = [x for x in str2 if 97 <= ord(x) <= 122]
print(new_str2)
2.3 比较运算符
2.3.1 比较是否相等: == 、!=
print('abc' == 'abc') # True
print('acb' == 'abc') # False
2.3.2 比较大小:>、<、>=、<=
两个字符串比较大小,比较的是第一对不相等的字符串编码值的大小
char = ?
判断是否是数字字符:‘0’<=char<=‘9’
判断是否是小写字母:‘a’<=char<=‘z’
判断是否是大写字符:‘A’<=char<=‘Z’
判断是否是字母:‘a’<=char<=‘z’ or ‘A’<=char<=‘Z’
判断是否是中文:’\u4e00’<=char<=’\u9fa5’
print('Myxy' > 'ab') # False
print('你好' > 'hello') # True
print('123' > 'stt') # False
# 练习
# 统计中文字符个数
# 打印字符中所有的数字
# 提取字符串中所有的字母
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
print(len([x for x in str3 if '\u4e00' <= x <= '\u9fa5']))
str_3 = ''
for x in str3:
if '0' <= x <= '9':
str_3 +=x
print(str_3)
print([x for x in str3 if '0' <= x <= '9'])
print([x for x in str3 if 'a' <= x <= 'z' or 'A' <= x <= 'Z'])
2.4 in和not in
字符串1和字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('abc' in 'abc123') # True
print(10 in [10,20,30]) # True
print([10,20] in [10,20,30]) # False
print('ac' in 'abc123') # False
2.5 r语法(r-string) - 在字符串的前面加r/R
如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失
str4 = r'\tabc\n12\'3\\'
print(str4)
path = R'c:\Users\name\a.txt'
print(path)
2.6 相关函数
len(字符串)
str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)
打印值会严格按照标准的写法来打印
eval(字符串) - 去掉字符串最外边的引号,获取数据(如果去掉引号后不是一个数据,就计算表达式的结果)
print(str(100)) # '100'
str(12.5) # '12.5'
print(str([10, 20, 30])) # '[10, 20, 30]'
print([1,2,3]) # [1, 2, 3]
res=eval('100') # 100
print(res,type(res)) # 100 <class 'int'>
res2=eval('[1,2,3]') # [1, 2, 3]
print(res2,type(res2)) # [1, 2, 3] <class 'list'>
str5="""{
'student':[
{'name':'达到','age':42},
{'name':'哈哈','age':12},
],
'name':'python'
}"""
res4 = eval(str5)
print(res4,res4['student'][1])
abc = 200
print(eval('abc'))
a=b=10
print(eval('a+b'))
3 字符串相关方法
3.1 join
字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串(序列中的元素必须是字符串)
list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result) # abcname123sdf
result1 = '+'.join(list1)
print(result1) # abc+name+123+sdf
result2 = '123'.join('abc')
print(result2) # a123b123c
# 练习1
list2 = ['abc', 100, True, 'hello']
result3 = ''.join([str(x) for x in list2])
print(result3)
# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello'] # abchello
result4 = ''.join([x for x in list2 if type(x) == str])
print(result4)
3.2 count
字符串1.count(字符串2) - 统计字符串1和字符串2出现的次数
message = 'how are you? i am fine! thank you! and you?'
result5 = message.count('you')
print(result5)
3.3 index/find
字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1的位置(位置是在0开始的下标)
字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1的位置(位置是在0开始的下标)
在字符串2不存在时,index报错,find不会报错并返回-1
rindex/rfind - 是从右往左找,找到最后一个字符串2
message = 'how are you? i am fine! thank you! and you?'
result6 = message.index('you')
print(result6)
result7 = message.find('you')
print(result7)
result8 = message.rfind('you')
print(result8)
3.4 split
字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
字符串1.split(字符串2,N) - 最多切N次
注意:无论切割点怎么分布,切完后小字符串的个数都是切割点的数量加一
message = 'mnabc123abcxyzabccoop'
result9 = message.split('abc')
print(result9) # ['mn', '123', 'xyz', 'coop']
message = 'abcmnabc123abcabcxyzabccoopabc'
result10 = message.split('abc')
print(result10) # ['', 'mn', '123', '', 'xyz', 'coop', '']
message = 'mnabc123abcxyzabccoop'
result11= message.split('abc',1)
print(result11) # ['mn', '123abcxyzabccoop']
3.5 replace
字符串1.replace(字符串2,字符串3) - 将字符串1中所有的字符串2替换成字符串3
字符串1.replace(字符串2,字符串3,N) - 只替换前N个
message = 'how are you? i am fine! thank you! and you?'
result12 = message.replace('you','me')
print(result12)
result13 = message.replace('you','me',2)
print(result13)
3.6 center\rjust\ljust\zfill
字符串1.center(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居中显示
字符串1.rjust(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居右显示
字符串1.ljust(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居左显示
字符串1.zfill(长度) == 字符串1.rjust(长度,‘0’)
3.7 strip/rstrip/lstrip
strip - 同时去掉字符串两边的空白
rstrip - 去掉字符串右边的所有空白
lstrip - 去掉字符串左边所有的空白
str2 = '\t abc 123 \n'
print('-------------------原来---------')
print(str2)
print('--------------去掉后------------')
print(str2.strip())
print('--------------去掉左边空白后------------')
print(str2.lstrip())
print('--------------去掉右边空白后------------')
print(str2.rstrip())
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
str1 = 'abcd1234 ' print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
str2 = input('请输入用户名:') if 6<=len(str2)<=10: print('用户名合法') else: print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
str3 = input('请输入用户名:') i=0 for x in range(len(str3)): if not ('0' <= str3[x] <= '9' or 'A' <= str3[x] <= 'Z' or 'a' <= str3[x] <= 'z'): i = 1 if i==0: print('用户名合法') else: print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
str4 = input('请输入用户名:') i=0 if 'A'<=str4[0]<='Z': for x in range(1,len(str4)): if not ('0'<=str4[x]<='9'or'A'<=str4[x]<='Z'or'a'<=str4[x]<='z'): i=1 if i==0: print('用户名合法') else: print('用户名不合法') else: print('用户名不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str5 =input('输入一个字符串:') new_str5 = ''.join([x for x in str5 if '0'<=x<='9']) print(new_str5)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str6 = input('输入一个字符串:') print(str6.upper()) print(''.join([chr(ord(x)-32) if 'a'<=x<='z' else x for x in str6]))
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
str7 = input('输入一个小于1000的数字:') str7_new=str7.rjust(4,'0') str_befor ='py1901' print(str_befor+str7_new)
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str8 = input('输入一个字符串:') print('字符串中非数字字母的字符的个数',len([x for x in str8 if not('0'<=x<='9'or 'a'<=x<='z'or'A'<=x<='Z')]))
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str9 = input('输入一个字符串:') str9_new=[x for x in str9] str9_new[0]='+' str9_new[-1]='+' print(''.join(str9_new))
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str10 = input('输入一个字符串:')
if len(str10)%2==1:
print(str10[len(str10)//2])
else:
print(str10[len(str10)//2-1]+str10[len(str10)//2])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str11='how are you? Im fine, Thank you!'
str_index = 'you'
str11_new=''
for x in range(len(str11)-len(str_index)+1):
str11_new=str11[x]+str11[x+1]+str11[x+2]
if str11_new==str_index:
print(x)
break
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str12 = 'asdfghjkl'
str13 = 'wedfvgbhjuik'
print(''.join([x for x in str12 if str13.find(x)>0]))