1.什么是字符串(str)
字符串是容器型数据类型(序列),将’‘单引号或则""双引号或者’’’’’’,""""""三引号作为容器标志,
里面每一个独立的符号就是字符串的一个元素。
字符串是不可变的;字符串是有序的(支持下标操作)
字符串的元素:引号里面的每一个符号都是字符串的元素,字符串的元素又叫字符。
字符分为两种:普通字符、转义字符
1)空串
empty1 = ''
empty2 = ""
empty3 = ''''''
empty4 = """"""
print(empty1, type(empty1), len(empty1)) # <class 'str'> 0
print(empty2, type(empty2), len(empty2)) # <class 'str'> 0
print(empty3, type(empty3), len(empty3)) # <class 'str'> 0
print(empty4, type(empty4), len(empty4)) # <class 'str'> 0
1)字符串的容器标志,’‘和""没有区别,’’’’’'和""""""没有区别
‘‘和""里面的内容不能通过直接按回车换行,只能通过转义字符换行;’’'和"""里面的内容可以直接通过回车换行。
str1 = ' '
print(str1, type(str1), len(str1)) # <class 'str'> 2
2.字符串的元素 - 字符
字符分为普通字符和转义字符两种
1)普通字符 - 在字符串中表示符号本身的字符
2)转义字符 - 使用\和其他符号一起来表示特殊功能和意义的字符
\n - 换行
\t - 水平制表符(相当于tab键)
\’ - 表示一个普通字符的单引号
\" - 表示一个普通字符的双引号
\\ - 表示一个普通字符的反斜杠
3)阻止转义 - 让字符串中所有的转义字符功能消失(让字符串中的每一个符号都表示符号本身)
在字符串前加r或者R:r’’ ; R’’
4) 转义字符 - 编码字符
\u4位的16进制数 - 16进制编码值对应的字符
print('\tabc\n123')
# print('i's me') # 会报错
print('i\'s me') # i's me
print("i's me") # i's me
print('is "A"') # is "A"
print('\u4E01') # 丁
# print('F:\new\py作业') # \n会换行
print('F:\\new\\py作业') # F:\new\py作业
print(r'F:\new\py作业') # F:\new\py作业
3.编码值 - 字符编码
1)编码值 - 计算机在存储符号的时候其实存的是符号对应的固定数字,这个数字就是符号对应的编码值
2)编码表 - 将字符和数字一一对应的表
ASCII码表:
1)总共有128个符号,只有美国常用符号,不包括中文
2)数字在字母的前面,大写字母在小写字母前面(A-Z=65-90,a-z=97-122),大写字母和小写字母中间有间隙
Unicode编码表(python):
1)Unicode编码表中包含ASCII码表,;
2)包含了目前世界所有国家所有民族的所有语言符号(万国码)
3)中文编码范围:4E00~9FA5
chr(编码值) - 获取编码值对应的字符
ord(字符) - 获取指定字符的编码值(凡是需要字符的地方,都给长度是1的字符串)
编码字符 - \u4e00 (如果\u后面不足4位数,则在前面补零,直到4位为止)
print(chr(97)) # 'a'
print(chr(0x4E01)) # '丁'
print(0x9fa6 - 0x4e00) # 20902
print(ord('贺'), ord('庭'), ord('杰'))
print(bin(ord('杰'))) # 0b110011101110000 bin() - 将其他进制的数据转换成2进制的数据
print(oct(ord('杰'))) # 0o63560 oct() - 将其他进制的数据转换成8进制的数据
print(hex(ord('杰'))) # 0x6770 hex() - 将其他进制的数据转换成16进制的数据
print('a123') # a123
print('\u0061123') # a123
1.内存单位
位(bit) - 计算机内存最小单位
字节(byte) 1字节 = 8位(bit)- 程序申请内存的最小单位
kb 1kb = 1024字节
MB 1MB = 1024kb
G 1G=1024MB
T 1T=1024G
2.进制
计算机中数字常见进制有4种:2进制、8进制、10进制、16进制。
1)2进制
"""
基数:0;1
进位:逢2进1
位权:2**(N-1) 110 = (1*2**2) + (1*2**1) + (0*2**0)= (4) + (2) + (0) = 6 (加括号便于阅读)
表示方式:加前缀 0b/0B
“”"
#### 任何数的0次方都是1 ####
2)8进制
"""
基数:0;1;2;3;4;5;6;7
进位:逢8进1
位权:8**(N-1) 12 = (1*8**1) + (2*8**0) = (8) + (2) = 10
表示方式:0o/0O
“”"
3)10进制
"""
基数:0;1;2;3;4;5;6;7;8;9
进位:逢10进1
位权:10**(N-1),123 = (1*10**2) + (2*10**1) + (3*10**0) = 100+20+3 = 123
表示方式:直接写
“”"
4)16进制
"""
基数:0;1;2;3;4;5;6;7;8;9;a/A(10);b/B(11);c/C(12);d/D(13);e/E(14);f/F(15)
进位:逢16进1
位权:16**(N-1) 1f = (1*16**1) + (f*16**0)= (16) + (f) = (16) + (15) =31
表示方式:0x/0X
“”"
print(0b110) # 6
print(0o12) # 10
print(0x1f) # 31
1.join
字符串.join(序列) - 将序列中的元素使用指定字符串连接产生一个新的字符串,序列中的元素必须是字符串
names = ['小明', '张三', '李四']
result = ''.join(names)
print(result) # '小明张三李四'
result = ' '.join(names)
print(result) # '小明 张三 李四'
result = '+'.join(names)
print(result) # '小明+张三+李四'
message = 'abc'
print('.'.join(message)) # 'a.b.c'
num = [10, 9, 78, 67]
result = ''.join([str(i)for i in num])
print(result) # '1097867'
list1 = ['name', 23, True, '你好', '哈哈']
# 'name+你好+哈哈'
result = '+'.join([i for i in list1 if type(i) == str])
print(result) # 'name+你好+哈哈'
2.split
字符串1.split(字符串2) - 将字符串中所有的字符串2作为切割点对字符串1进行切割
切割完的字符串段数为字符串2的总数+1
字符串1.split(字符串2,N) - 将字符串1中1前N个字符串2作为切割点进行切割
str1 = 'how are you? i am fine, thank you! and you?'
result = str1.split(' ')
print(result) # ['how', 'are', 'you?', 'i', 'am', 'fine,', 'thank', 'you!', 'and', 'you?']
result = str1.split('you')
print(result) # ['how are ', '? i am fine, thank ', '! and ', '?']
print('abca123aamna'.split('a')) # ['', 'bc', '123', '', 'mn', '']
str1 = 'abc12mn12xy12===12++'
print(str1.split('12', 2)) # ['abc', 'mn', 'xy12===12++']
3.replace
字符串1.replace(字符串2,字符串3) - 将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2,字符串3,N) - 将字符串1中前N个字符串2都替换成字符串3
str1 = 'how are you? i am fine, thank you! and you?'
result = str1.replace('you', 'me')
print(result) # 'how are me? i am fine, thank me! and me?'
print(str1.replace('you', 'me')) # 同上↑
print(str1.replace('you', 'me', 2)) # how are me? i am fine, thank me! and you?
补充
字符串.zfill(长度) - 将字符串转换成指定长度的新字符,不够的在前面用0填充
print('9'.zfill(3)) # 009
字符串.center(长度,填充字符)
字符串.ljust(长度,填充字符)
字符串.rjust(长度,填充字符)
print('abc'.center(5, '+')) # +abc+
print('abc'.ljust(5, '+')) # abc++
print('abc'.rjust(5, '+')) # ++abc
print('1'.rjust(3, '0')) # 001
print('abc'.center(3, '+')) # abc
print('abc'.center(4, '+')) # abc+
字符串.isnumeric() - 判断字符串中是否只包含数字字符,字符0~9和符号本身意义是数值的字符都是True
字符串.isdigit() - 只有字符0~9是True
字符串.isdecimal() - 判断是否是10进制数字字符
字符串.islower() - 判断字符串中的字母是否是小写字母
字符串.isupper() - 判断字符串中的字母是否是大写字母
print('一百'.isnumeric()) # True
print('1'.isdigit()) # True
print('9'.isdecimal()) # True
print('a'.islower()) # True
print('A'.isupper()) # True
字符串相关操作
1.查
字符串获取字符和列表获取元素的语法一样
message = 'you see see one day day!'
print(message[2]) # u
一个空格是一个字符
str1 = 'abc 123'
print(str1[4]) # 1
一个转义字符是一个字符,长度是1
str2 = '\tabc\u4fa9 123'
print(str2[6]) # 1
message = 'you see see one day day!'
print(message[1:5]) # ou s
print(message[:-5:-1]) # !yad
for i in 'ab\u67afc':
print(i, end='') # ab枯c
2.运算符
字符串1 + 字符串2 - 将两个字符串拼接产生一个新字符串
字符串 * N - 将字符串重复N次产生一个新的字符串
print('abc' + '123') # abc123
print('abc' == 'acb') # False
print('a' == '\u0061') # True
比较大小:> 、 < 、 >= 、 <=
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
"""
是否是数字字符:‘0’ <= char <=‘9’
是否是小写字母:‘a’<= char <=‘z’
是否是大写字母:‘A’<= char <=‘Z’
是否是字母:‘a’<= char <=‘z’ or ‘A’<= char <=‘Z’
判断是否是中文:’\u4e00’<= char <=’\u9fa5’
“”"
print('abc' > 'cd') # False
print('abc' > 'Cd') # True
练习:提取一个字符串中所有的数字字符
str1 = 'sh函数78sk--好2o'
str2 = ''
for i in str1:
if '0' <= i <= '9':
str2 += i
print(str2) # 782
str3 = ''
for i in str1:
if '\u4e00' <= i <= '\u9fa5':
str3 += i
print(str3) # 函数好
3.in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('abc' in 'a1b2c3') # False
print('abc' in 'abc123') # True
4.len、str
str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串,转换的时候在数据打印值外加引号)
print(str(100)) # '100'
print(str(12.5)) # '12.5'
list1 = [1, 2, 3]
print(str(list1)) # '[1, 2, 3]'
print(str(list1)[0]) # '['
dict1 = {'name': '小明', 'age': 18}
print(str(dict1)) # '{'name': '小明', 'age': 18}'
print(str(dict1)[0]) # '{'
dict2 = {"name": '小明', 'age': 18}
print(dict2) # {'name': '小明', 'age': 18}
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
str1 = input('请输入一个字符串:') print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
username = input('请输入你的用户名:') if 5 < len(username) < 11: print('用户名合法,可以使用!') else: print('用户名不合法!')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
username = input('请输入你的用户名:') for i in username: if '0' <= i <= '9': pass elif 'a' <= i <= 'z': pass elif 'A' <= i <= 'Z': pass else: print('用户名不合法') break else: print('用户名合法') # 优化写法 for i in username: if not ('0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z'): print('用户名不合法') break else: print('用户名合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
nums = set([chr(i) for i in range(ord('0'), ord('9')+1)]) alp = set([chr(i) for i in range(ord('a'), ord('z')+1)]) Alp = set([chr(i) for i in range(ord('A'), ord('Z')+1)]) username = input('请输入你的用户名:') set_name = set(username) nums_in_name = set_name - alp - Alp if username[0].isupper(): if len(nums_in_name) != 0 and len(nums_in_name - nums) == 0: print('用户名合法') else: print('用户名不合法,必须包含数字和字母') else: print('用户名不合法,首字母必须是大写')
# 方法2 username = input('请输入你的用户名:') if 'A' <= username[0] <= 'Z': count = 0 for i in username[1:]: if not ('0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z'): print('不合法') break else: if '0' <= i <= '9': count += 1 else: if count == 0: print('不合法') else: print('合法') else: print('不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
nums = input('请输入一个带数字的字符串:') new_nums = '' new_nums = ''.join([i for i in nums if '0' <= i <= '9']) print(new_nums)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = input('请输入一个带小写字母的字符串:') print(str1.upper()) # 方法2 str1 = input('请输入一个带小写字母的字符串:') str2 = '' for i in str1: if 'a' <= i <= 'z': str2 += chr(ord(i)-32) else: str2 += i print(str2) #方法3 str1 = input('请输入一个带小写字母的字符串:') print(''.join(chr(ord(i)-32) if i .islower() else i for i in str1))
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
stu_num = 'py1901' nums = input('请输入学生的学号(1000以内):') str0 = '0' if len(nums) > 3: print('输入一个1000以内的数') else: while len(nums) != 3: nums = str0 + nums print(stu_num+nums) nums = input('请输入学生的学号(1000以内):') stu_num = 'py1901' print(stu_num + '0'*(3-len(nums)) + nums)
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
count = 0 str1 = input('请输入一个字符串:') for i in str1: if '0' <= i <= '9': continue elif 'a' <= i <= 'z': continue elif 'A' <= i <= 'Z': continue else: count += 1 else: print(count) # 方法2 count = 0 for i in str1: if not (i.isdigit() or i.islower() or i.isupper()): count += 1 print(count)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
# 方法1 str1 = input('请输入一个字符串:') str2 = '' for i in range(len(str1)): if i == 0 or i == len(str1)-1: str2 += '+' else: str2 += str1[i] print(str2) # 最优写法 print('+' + str1[1:-1] + '+')
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = input('请输入一个字符串:')
result1 = len(str1)%2
result2 = len(str1) // 2
if result1 == 0:
print(str1[result2-1]+str1[result2])
else:
print(str1[result2])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
# 方法1
str1 = 'how are you? Im fine, Thank you!'
result = len(str1.split('you')[0])
if result == len(str1):
print('没有该子串')
else:
print(result)
# 方法2
length = len('you')
for i in range(len(str1)-2):
if str1[i:i+length] == 'you':
print(i)
break
else:
print('没有该子串')
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
print(set(str1) & set(str2)) # {'3', 'a'}
print(''.join(set(str1) & set(str2))) # 3a