day2.24集合和字符串
集合
认识集合(set)
'''
集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开;{数据1,数据2,数据3,...}
可变的(支持增删改的操作);无序的(不支持下标操作)
元素的要求;1.必须是不可变的数据 2.元素是唯一的
'''
# 空集合
set1 = set()
print(type(set1))
# 集合石无序的
print({1,2,3} == {3,2,1})
# 集合元素必须是不可变的数据类型
set1 = {1,'abc',True,(10,20)}
print(set1)
# set1 = {1,'abc',True,[10,20]} # TypeError: unhashable type: 'list'
# 集合元素是唯一的
set1 = {10,20,10,30,50,30,20}
print(set1) # {10, 20, 50, 30}
# 2.集合的增删改查(不重要)
# 1)查 - 只能遍历
# 补充;用for循环遍历无序序列时,系统会自动将无序序列转换成列表,然后再进行遍历
# 2)增
'''
集合.add(元素)
集合.update(序列) - 将序列中的所有元素都添加到集合中
'''
# 删
'''
集合.remove(元素)
'''
集合的数学运算
# python中使用的集合和数学中的集合是一个东西,并且支持数学集合运算
# python支持的数学几何运算;交集(&),并集(|),差集(-),对称差集(^),子集(>=,<=),真子集(<,>)
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
# 1)交集 - 获取两个集合的公共部分
print(set1 & set2)
# 2)并集 - 将两个集合合并成一个集合
print(set1 | set2)
# 3)差集
# 集合1 - 集合2 - 获取集合1中去掉包含集合2中的部分剩下的部分
print(set1 - set2)
# 4)对称差集 - 将两个集合合并然后去掉公共部分
print(set1 ^ set2)
# 5)子集和真子集
# 集合1 > 集合2 - 判断集合2是否是集合1的真子集
# 集合1 < 集合2 - 判断集合1是否是集合2的真子集
# 集合1 >= 集合2 - 判断集合2是否是集合1的子集
# 集合1 <= 集合2 - 判断集合1是否是集合2的子集
# 用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)
print()
set_Chinese = {'张三','李四','王五','赵六','钱七','小明','小红'}
set_math = {'小明','小红','小白','张三','李四','王五'}
set_English = {'可可','乐乐','花花','小红','小白','张三','李四'}
# 1. 求选课学生总共有多少人
print(len(set_math | set_English | set_Chinese))
print()
# 2. 求只选了第一个学科的人的数量和对应的名字
print(len(set_Chinese))
for i in set_Chinese:
print(i)
print()
# 3. 求只选了一门学科的学生的数量和对应的名字
print(len(set_Chinese ^ set_math ^ set_English))
for i in set_Chinese ^ set_math ^ set_English:
print(i)
print()
# 4. 求只选了两门学科的学生的数量和对应的名字
# 错误做法
# list1 = [i for i in set_Chinese & set_math]
# list2 = [i for i in set_Chinese & set_English]
# list3 = [i for i in set_math & set_English]
# set_a = set(list1)
# set_b = set(list2)
# set_c = set(list3)
# print(len(set_c ^ set_b ^ set_a))
# print(set_c ^ set_b ^ set_a)
# print()
# # 5. 求选了三门学生的学生的数量和对应的名字
print(len(set_Chinese & set_math & set_English))
for i in set_Chinese & set_math & set_English:
print(i)
认识字符串和字符
什么是字符串(str)
'''
字符串是容器型数据类型,将'',"",'''''',""""""作为容器的标志,引号里面的每一个符号都是字符串的元素(字符串的元素又叫字符)
不可变的(不支持增删改);有序的(支持下表操作)
字符串的元素;一切符号都可以作为字符串的元素,字符串的元素又叫做字符,字符分为两种;普通字符和转义字符
'''
# 空串
str1 = ''
# 字符可以是任何符号
字符 - 字符串中的每一个独立的符号就是一个字符
'''
字符分为普通字符和转义字符
1)普通字符 - 表示符号本身的字符就是普通字符
2)转义字符 - 具备特殊功能或者特殊意义的符号,所有的转义字符的通用格式:\c,\cccc
(转义字符是通过\加普通字符构成的,但是不是所有的普通的字符前加\都可以构成转义字符
\n - 换行
\t - 水平制表符(相当于按一次tab键)
\' - 一个单引号
\" - 一个双引号
\\ - 一个反斜杠
注意;所有的转义字符长度都是1
'''
# \u4位的16进制数 - 编码字符(4位的16进制数是字符在计算机中的编码值)
# 16进制数 - 每一位上的数可以是0-9或者是a-f(A-F)
print('\u8848')
字符编码
计算机存储数据的原理
'''
计算机能够储存的数据只有数字,存数子的时候保存的是数字的补码
如果想要将非数字数据保存到计算机中,存储的时候一定会现将数据转换成数字
如果需要存储的是文字,计算机会保存这个文字符号对应的编码值
'''
编码值
'''
每个文字(字符)在计算机中都对应一个固定的数字,这个数字就是这个符号的编码值
'''
字符编码表 - 记录符号和数字对应关系的表
'''
常用编码表;ASCII码表、Unicode编码表(Python)
1)ASCII码表
ASCII码表只有128个字符(不够用)
在ASCII码表中;数字字符在字母前面、大写字母在小写字母前面、大写字母和小写字母之间有间隙
数字从0开始连续递增,字母从(a/A)开始连续递增
2)Unicode编码表 - 是ASCII码表的扩展,里面包含ASCII码表
Unicode编码表包含了世界上所有的国家所有的民族所有的符号(万国码)
中文编码范围;4e00~9fa5
'''
编码值在python中的应用
'''
1)chr函数;chr(编码值) - 根据编码值获取字符;编码值 - 整数
2)ord函数;ord(字符) - 获取字符对应的编码值;字符 - 长度是1的字符串
3)编码字符;
'''
# 程序中直接表示一个16进制数;加前缀0x/0X
for i in range(0x4def,0x4dff+1):
print(chr(i))
# hex(数字) - 将数字转换成16进制
print(ord('赵'),ord('春'),ord('雨'))
# 编码字符
str1 = '\u0061---\u0030'
print(str1)
字符串常用操作
查
# 字符串获取字符和列表获取元素语法一模一样
字符串的相关操作
# 1)+、*
# 2)比较大小;>,<,>=,<=
'''
两个字符串比较大小,比较的是第一段不相等的字符的编码值大小
应用;判断字符的性质
a.判断字符x是否是数字字符;'0' <= x <= '9'
b.判断字符x是否是小写字母;'a' <= x <= 'Z'
c.判断字符x是否是大写字母;'A' <= x <= 'Z'
d.判断字符x是否是字母;'a' <= x <= 'z' or 'A' <= x <= 'Z'
e.判断字符x是否是中文;'\u4e00' <= x <= '\u9fa5'
'''
print('abc' > 'mn')
in 和 not in
# 字符串1 in 字符串2 - 判断字符串是否在字符串2中(判断字符串1是否是字符串2的字串)
# 字符串1 not in 字符串2 - 判断字符串是否不在字符串2中串
作业
- 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = 'abcd1234 ' for i in range(1,len(str1),2): print(str1[i],end='')
- 输入用户名,判断用户名是否合法(用户名长度6~10位)
str1 = input('请输入用户名;')
if 8 <= len(str1) <= 16:
print('合法')
else:
print('不合法')
- 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
str1 = input('请输入用户名;') for i in str1: if not '0' <= i <= '9' and not 'A' <= i <= 'Z' and not 'a' <= i <= 'z': print('不合法') break else: print('合法')
- 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
str1 = input('请输入用户名;') if 'A' <= str1[0] <= 'Z': for i in str1: if not '0' <= i <= '9' and not 'A' <= i <= 'Z' and not 'a' <= i <= 'z': print('不合法') break else: for i in str1: if '0' <= i <= '9': print('合法') break else: print('不合法') else: print('不合法')
- 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = 'abc1shj23kls99+2kkk' str2 = '' for i in str1: if '0' <= i <= '9': str2 += i print(str2)
- 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = 'a2h2klm12+' # 方法1 print(str1.upper()) # 方法2 str2 = '' for i in str1: if 'a' <= i <= 'z': i = chr(ord(i) - 32) str2 += i else: str2 += i print(str2)
- 输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
str1 = input('请输入数字(小于1000);') str2 = 'py1901' if len(str1) <= 2: str1 = '0' * (3 - len(str1)) + str1 print(str2 + str1)
- 输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input('请输入字符串;') count1 = 0 for i in str1: if not '0' <= i <= '9' and not 'A' <= i <= 'Z' and not 'a' <= i <= 'z': count1 += 1 print(count1)
- 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str1 = input('请输入字符串;') str2 = str1[1:-1] print('+' + str2 + '+')
b
- 输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = input('请输入字符串;') if len(str1) % 2: print(str1[len(str1) // 2]) else: print(str1[(len(str1) // 2 - 1):(len(str1) // 2 + 1)])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!' str2 = 'you' num1 = len(str2) for i in range(len(str1) - len(str2)): if str1[i:i+len(str2)] == str2: print(i) break
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123' str2 = 'huak3' str3 = '' for i in str1: if i in str2: str3 += i print(str3)