集合和字符串学习总结
一、集合
1.认识集合(set)
-
集合是容器型数据类型,将作为容器的标志里面多个数据用逗号隔开︰{数据1,数据2,数据3;…}
-
a可变的(支持增删改)
-
b.无序(不支持下标操作)
print({1, 2, 3} == {3, 2, 1}) # True
-
c.元素要求:
-
必须是不可变的数据
set2 = {1, 'acb', True, [10, 20]} # 报错!
-
元素是唯一的
set3 = {10, 20, 10, 20, 30, 10} print(set3) # {10, 20, 30}
-
空集合: set()
set1 = set() print(type(set1), len(set1)) #<class 'set'> 0
-
-
2.集合的增删改
-
a.查 —— 只能遍历
用for循环遍历无序序列的时候,系统在遍历之前会自动将无序序列转换成列表,然后再遍历列表
set1 = {'进击的巨人', '海贼王', '一拳超人', '我的超人学院', '一人之下', '死亡笔记'} print(list(set1)) for x in set1: print(x) #['死亡笔记', '一拳超人', '我的超人学院', '进击的巨人', '一人之下', '海贼王']
-
b.增
-
集合.add(元素)—— 添加指定元素
set1 = {'进击的巨人', '海贼王', '一拳超人', '我的超人学院', '一人之下', '死亡笔记'} print(set1) set1.add('死神') print(set1) # {'死亡笔记', '一人之下', '死神', '一拳超人', '进击的巨人', '我的超人学院', '海贼王'}
-
集合.update(元素)—— 将序列中所有的元素都添加到集合中
set1 = {'进击的巨人', '海贼王', '一拳超人', '我的超人学院', '一人之下', '死亡笔记'} set1.update('abc') print(set1) #{'进击的巨人', '一拳超人', '我的超人学院', '一人之下', 'a', 'c', '海贼王', '死亡笔记', 'b'}
-
-
c.删
-
集合.remove(元素)
set1 = {'进击的巨人', '海贼王', '一拳超人', '我的超人学院', '一人之下', '死亡笔记'} set1.remove('海贼王') print(set1) #{'进击的巨人', '一人之下', '一拳超人', '死亡笔记', '我的超人学院'}
-
3.数学集合运算
-
Python中使用的集合与数学中的集合相同,支持数学运算
-
支持的数学运算:交集(&),并集(|),差集(-),对称差集(^),子集(>=,<=),真子集(>,<)
set1 = {1, 2, 3, 4, 5} set2 = {3, 4, 5, 6, 7, 8} # 1) 交集 - 获取两个集合的公共部分 print(set1 & set2) # {3, 4, 5} # 2)并集 - 将两个集合合并成一个集合 print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8} # 3)差集 # 集合1 - 集合2 - 获取集合1中去掉包含在集合2中的部分剩下的部分 print(set1 - set2) # {1, 2} print(set2 - set1) # {8, 6, 7} # 4)对称差集 - 将两个集合合并然后去掉公共部分 print(set1 ^ set2) # {1, 2, 6, 7, 8} # 5)子集和真子集 # 集合1 > 集合2 - 判断集合2是否是集合1的真子集 # 集合1 < 集合2 - 判断集合1是否是集合2的真子集 print({1, 2} < {1, 2, 3}) # True print({100, 200, 300, 400, 1, 2} > {1, 2}) # True # {1, 2, 3} 真子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3} # {1, 2, 3} 子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3}, {1, 2, 3}
-
二、字符串
-
1.什么是字符串(str)
-
容器型数据类型,将’’、""、’’’’’’、""""""作为容器的标志,引号里面的每一个符号都是字符串的元素(又叫字符)
-
不可变的(不支持增删改),有序的(支持下标操作)
-
一切符号都可以作为字符串的的元素,字符串的元素又叫字符,字符分为两种:普通字符和转义字符
-
-
2.字符 —— 字符中每个独立的符号就是一个字符
-
普通字符 —— 表示符号本身的字符
-
转义字符 —— 具备特殊或者特殊意义的符号就是转义字符。所有的转义字符的通用格式:\X、\XXX (转义字符是通过 \N 加普通字符构成的,但是不是所有的普通字符前加都可以变成转义字符)。所有的转义字符长度为1
\n —— 换行 \t —— 水平制表(相当于按一次tab键) \' —— 一个单引号 \" —— 一个双引号 \\ —— 一个反斜杠
-
\u4位的十六进制数 - 编码字符(4位的十六进制数是字符在计算机中的编码值)
十六进制数 - 每一位上的数可以是0-9或者a-f(A-F)
-
三、字符编码
-
1.计算机储存原理
-
计算机能够直接存储的数据只有数字,存数字的时候保存数字的补码
-
如果想要将非数字数据保存到计算机中,存储的时候一定会先将数据转换成数字。
-
如果需要存储的是文字,计算机会保存这个文字符号对应的编码值。
-
-
2.编码值
- 每个文字符号(字符)在计算机中都对应一个固定的数字,这个数字就是这个符号的编码值 -
3.字符编码表 —— 记录每个符号和数字对应关系的表
-
常用编码表:
-
ASCII码表:
ASCII码表只有128个字符
在ASCII码表中,数字字符在字母的前面、大写字码在小写字母的前面,之间有间隙,数字从 0开始 连 续递增,字母从(a(97)/A(56)开始连续递增-
UNicode编码表:
Unicode编码表-是ASCII码表的扩展,里面包含ASCII码表,世界上已知所有的国家所有的民族的所有符号
中文编码范围:4e00 ~ 9fa5
-
-
-
4.编码值在python中的应用
-
a. chr函数:chr(编码值)—— 根据编码值对应的字符;编码值–整数
-
b.ord函数:ord(字符)—— 获取字符对应的编码值;字符–长度是1的字符串程
序中直接表示一个16进制数:加前缀0x/0X
将数字转化成16进制:hex(数字) -
c.编码字符:
str1 = 'a\u0061一\u4e00' print(str1)
-
四、字符串常用操作
-
1.查 —— 获取字符
- 字符串获取字符和列表获取元素的语言一模一样
-
2.运算符 —— +、*
-
比较大小:>、<、>=、<=
两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
str1 = 'abc' str2 = '123' print(str1 + str2) # 'abc123' print(str1 * 3) # 'abcabcabc'
-
应用:a.判断字符x是否是数字字符:‘0’<= x <=‘9’
b.判断字符x是否是小写字母:‘a’<= x <=‘z’
c.判断字符x是否是大写字母: ‘A’<= x <=‘Z’
d.判断字符x是否是字母:‘a’<= x <=‘z’ or ‘A’<= x <=‘Z’
e.判断字符x是否是中文:’\u4e00’<= x <=’\u9fa5’
-
-
3.in 和 not in
-
字符串1 in 字符串2 —— 判断字符串1是在字符串2中(判断字符串1是否是字符串2的子串)
str1 = 'abc123' print('a' in str1) # True print('abc' in str1) # True print('23' in str1) # True print('13' in str1) # False
-
字符串作业
1.输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 ='abcd1234'
for x in range(len(str1)):
if x % 2 == 1:
print(str1[x])
2.输入用户名,判断用户名是否合法(用户名长度6~10位)
str1 = input('请输入用户名:')
if 6 <= len(str1) <= 10:
print('用户名合法')
else:
print('用户名不合法')
3.输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
str1 = input('请输入用户名:')
if '0' <= str1[:] <= '9' or 'a' <= str1[:] <= 'z' or 'A' <= str1[:] <= 'Z':
print('用户名合法')
else:
print('用户名不合法')
4.输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
5.输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = input('请输入用户名:')
new_str = ''
for x in str1:
if '0' <= x <= '9':
new_str += x
print(new_str)
6.输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = input('请输入用户名:')
print(str.upper(str1))
7.输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
str1 = input('请输入用户名:')
num_str = 'py1901' + str1.zfill(3)
print(num_str)
8.输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input(':')
count = 0
for x in str1:
if not ('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'):
count += 1
print(count)
9.输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
10输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = input('输入一个字符串:')
new_str = ''
if len(str1) % 2:
new_str += str1[int(len(str1)/2)]
else:
new_str += str1[int(len(str1)/2-1)]
new_str += str1[int(len(str1) / 2)]
print(new_str)
11.写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!'
print(str1.find('you'))
12获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
set1 = set(str1)
set2 = set(str2)
print('公共字符有:', set1 & set2)