day9总结和作业
一、集合
1.认识集合(set)
集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开:{数据1,数据2,数据3,…}
可变的(支持增删改);无序(不支持下标操作)
元素的要求:1.必须是不可变的数据 2.元素是唯一的
空集合: set()
集合是无序的
print({1, 2, 3} == {3, 2,1}) # True
集合元素必须是不可变类型的数据
集合元素是唯一
set3 = {10, 20, 10, 20, 30, 10}
print(set3) # {10, 20, 30}
2.集合的增删改查(不重要)
1)查,只能遍历
set1 = {'进击的巨人', '海贼王', '一拳超人', '火影忍者'}
for x in set1:
print(x)
2)增
集合.add(元素) - 添加指定元素
集合.update(序列) - 将序列中所有的元素都添加到集合中
3)删
set1 = {'进击的巨人', '海贼王', '一拳超人', '我的超人学院', '一人之下', '死亡笔记'}
set1.remove('海贼王')
print(set1)
集合.remove(元素)
3.数学集合运算
python中使用的集合和数学集合是一个东西,并且支持数学集合运算
python支持的数学集合运算:交集 A&B 并集 A|B 差集(-) 对称差集(^)子集(>= <=)真子集(< 、 >)
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7, 8}
# 1) 交集 - 获取两个集合的公共部分
print(set1 & set2) # {3, 4, 5}
# 2)并集 - 将两个集合合并成一个集合
print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8}
# 3)差集
# 集合1 - 集合2 - 获取集合1中去掉包含在集合2中的部分剩下的部分
print(set1 - set2) # {1, 2}
print(set2 - set1) # {8, 6, 7}
# 4)对称差集 - 将两个集合合并然后去掉公共部分
print(set1 ^ set2) # {1, 2, 6, 7, 8}
# 5)子集和真子集
# 集合1 > 集合2 - 判断集合2是否是集合1的真子集
# 集合1 < 集合2 - 判断集合1是否是集合2的真子集
print({1, 2} < {1, 2, 3}) # True
print({100, 200, 300, 400, 1, 2} > {1, 2}) # True
# {1, 2, 3} 真子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3}
# {1, 2, 3} 子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3}, {1, 2, 3}
二、字符串和字符
1.什么是字符串(str)
字符串是容器型数据类型,将’ ’ " " ‘’’’’’ “”" “”“ 作为容器的标志,引号里面的一个符号都是字符串的元素(字符串的元素又叫字符)
不可变的(不支持增删改),有序的(支持下标操作)
字符串的元素:一切符号都可以作为字符串的元素,字符串的元素又叫字符。字符分为两种:普通字符和转义字符。
空串 str =’’ 中间没有空格,空格也算数据
str5 = ''
print(len(str5)) # 0
字符可以是任何符号
str7 = 'sfhJAMF234沙士大夫~!@#$%([}❀😁'
print(str7)
2.字符 - 字符串中的每个独立的符号就是一个字符
普通字符:表示符号本身的字符就是普通字符
转义字符:具备特殊功能或者特殊意义的符号就是转义字符。所有的转义字符的通用格式:\x \xx
\n - 换行
\t - 水平制表符(相当于按一次tab键)
\' - 一个单引号
\" - 一个双引号
\\ - 一个反斜杠
\u4位的十六进制数 - 编码字符(4位的十六进制数是字符在计算机中的编码值)
十六进制数 - 每一位上的数可以是0-9或者a-f
比如\uaf12 其中af12就是字符编码
注意:所有的转义字符的长度都是1
三、字符编码
1.计算机存储数据的原理
计算机能够直接存储的数据只有数字,存数字的时候保存的是数字的补码
如果想要将非数字数据保存到计算机中,存储的时候一定会先将数据转换成数字
如果需要存储的是文字,计算机会保存这个文字符号对应的编码值。
2.字符编码
每个文字符号(字符)在计算机中都对应一个固定的数字,这个数字就是这个符号的编码值。
3.字符编码表 - 记录每个符号和数字对应关系的表
常用编码表:ASCII码表、Unicode编码表(python)
ASCII码表只有128个字符(不够用)
在ASCII码表中:数字字符在字母的前面、大写字母在小写字母的前面,大写字母和小写字母之间有间歇、
数字从0开始连续递增,字母从(a/A)开始连续递增
a - 97
A - 65
Unicode编码表:是ASCII码表的扩展,里面包含ASCII码表
中文编码范围:4e00 ~ 9fa5
4.编码值在python中的应用
1)chr函数:chr(编码值) - 获取编码值对应的字符;编码值 -整数
2)ord函数:ord(字符) - 获取字符对应的编码值;字符 - 长度是1的字符串
3)编码字符
# 判断指定的字符是否是中文字符
ch = '是'
print('\u4e00' <= ch <= '\u9fa5')
print(chr(0x9fa5))
程序中直接表示一个16进制数:加前缀0x或者0X
四、字符串常用操作
1.查 - 获取字符
字符串获取字符和列表获取元素的语法一模一样
str1 = 'hello world!'
print(str1[1], str1[-1])
str2 = '\t123\u5fa3abc'
print(str2[5])
str1 = 'hello world!'
print(str1[-3:]) # 'ld!'
print(str1[-5::-1]) # 'ow olleh'
for x in str1:
print(x)
2.字符串相关操作
# 1) +、*
str1 = 'abc'
str2 = '123'
print(str1 + str2) # 'abc123'
print(str1 * 3) # 'abcabcabc'
# 2) 比较大小: >、<、>=、<=
"""
两个字符串比较大小,比较的是第一对不相等的字符的编码值大小;
应用:判断字符的性质
a. 判断字符x是否是数字字符: '0' <= x <= '9'
b. 判断字符x是否是小写字母: 'a' <= x <= 'z'
c. 判断字符x是否是大写字母: 'A' <= x <= 'Z'
d. 判断字符x是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
e. 判断字符x是否是中文:'\u4e00' <= x <= '\u9fa5'
"""
print('abc' > 'Zn')
# 3) in 和 not in
# 字符串1 in 字符串2 - 判断字符串1是在字符串2中(判断字符串1是否是字符串2的子串)
str1 = 'abc123'
print('a' in str1) # True
print('abc' in str1) # True
print('23' in str1) # True
print('13' in str1) # False
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = 'abcd1234' print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
name = input('请输入用户名:') if 6 < len(name) < 10: print('用户名合法') else: print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
name = input('请输入用户名:') for x in name: if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z': print('用户名合法') else: print('用户不合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str = 'abc1shj23kls99+2kkk' str2 = '' for x in str: if '0' <= x <= '9': str2 += x print(str2)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = 'a2h2klm12+' print(str1.upper())
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3