第013课:常⽤数据结构之集合

在学习了列表和元组之后,我们再来学习⼀种容器型的数据类型,它的名字叫集合( set )。说到集合这个词⼤家⼀定不会陌⽣,在数学课本上就有这个概念。通常我们对集合的定义是“ 把⼀定范围的、确定 的、可以区别的事物当作⼀个整体来看待 ,集合中的各个事物通常称为集合的元素。集合应该满⾜以下特性:
1. ⽆序性 :⼀个集合中,每个元素的地位都是相同的,元素之间是⽆序的。
2. 互异性 :⼀个集合中,任何两个元素都认为是不相同的,即每个元素只能出现⼀次。
3. 确定性 :给定⼀个集合,任给⼀个元素,该元素或者属于或者不属于该集合,⼆者必居其⼀,不允许有模棱两可的情况出现。
Python 程序中的集合跟数学上的集合是完全⼀致的,需要强调的是上⾯所说的⽆序性和互异性。⽆序性说明集合中的元素并不像列中的元素那样⼀个挨着⼀个,可以通过索引的⽅式实现随机访问(随机访问指的是给定⼀个有效的范围,随机抽取出⼀个数字,然后通过这个数字获取到对应的元素),所以Python中的 集合肯定不能够⽀持索引运算 。另外,集合的互异性决定了 集合中不能有重复元素 ,这⼀点也是集合区别于列表的关键,说得更直⽩⼀些就是,Python 中的集合类型具有去重特性。当然,Python中的集合⼀定是⽀持 in not in 成员运算的,这样就可以确定⼀个元素是否属于集合,也就是上⾯所说的集合的确定性。集合的成员运算在性能上要优于列表的成员运算 ,这是集合的底层存储特性决定的,此处我们暂时不做讨论,先记下这个结论即可。
创建集合
Python 中,创建集合可以使⽤ {} 字⾯量语法, {} 中需要⾄少有⼀个元素,因为没有元素的 {} 并不是空集合⽽是⼀个空字典,我们下⼀节课就会⼤家介绍字典的知识。当然,也可以使⽤内置函数 set 来创建⼀个集合,准确的说 set 并不是⼀个函数,⽽是创建集合对象的构造器,这个知识点我们很快也会讲到,现在不理解跳过它就可以了。要创建空集合可以使⽤ set() ;也可以将其他序列转换成集合,例如: set('hello') 会得到⼀个包含了 4 个字符的集合(重复的 l 会被去掉)。除了这两种⽅式,我们还可以使⽤⽣成式语法来创建集合,就像我们之前⽤⽣成式创建列表那样。要知道集合中有多少个元素,还是使⽤内置函数 len ;使⽤ for 循环可以实现对集合元素的遍历。
# 创建集合的字⾯量语法(重复元素不会出现在集合中)
set1 = {1, 2, 3, 3, 3, 2}
print(set1) # {1, 2, 3}
print(len(set1)) # 3
# 创建集合的构造器语法(后⾯会讲到什么是构造器)
set2 = set('hello')
print(set2) # {'h', 'l', 'o', 'e'}
# 将列表转换成集合(可以去掉列表中的重复元素)
set3 = set([1, 2, 3, 3, 2, 1])
print(set3) # {1, 2, 3}
# 创建集合的⽣成式语法(将列表⽣成式的[]换成{})
set4 = {num for num in range(1, 20) if num % 3 == 0 or num % 5 == 0}
print(set4) # {3, 5, 6, 9, 10, 12, 15, 18}
# 集合元素的循环遍历
for elem in set4:
 print(elem)
需要提醒⼤家,集合中的元素必须是 hashable 类型。所谓 hashable 类型指的是能够计算出哈希码的数据类型,你可以暂时将哈希码理解为和变量对应的唯⼀的ID 值。通常不可变类型都是 hashable 类型,如整数、浮点、字符串、元组等,⽽可变类型都不是 hashable 类型,因为可变类型⽆法确定唯⼀的 ID值,所以也就不能放到集合中。集合本身也是可变类型,所以集合不能够作为集合中的元素,这⼀点请⼤家⼀定要注意。
集合的运算
Python 为集合类型提供了⾮常丰富的运算符,主要包括:成员运算、交集运算、并集运算、差集运算、⽐较运算(相等性、⼦集、超集)等。
成员运算
可以通过成员运算 in not in 检查元素是否在集合中,代码如下所示。
set1 = {11, 12, 13, 14, 15}
print(10 in set1) # False
print(15 in set1) # True
set2 = {'Python', 'Java', 'Go', 'Swift'}
print('Ruby' in set2) # False
print('Java' in set2) # True
交并差运算
Python 中的集合跟数学上的集合⼀样,可以进⾏交集、并集、差集等运算,⽽且可以通过运算符和⽅法调⽤两种⽅式来进⾏操作,代码如下所示。
set1 = {1, 2, 3, 4, 5, 6, 7}
set2 = {2, 4, 6, 8, 10}
# 交集
# ⽅法⼀: 使⽤ & 运算符
print(set1 & set2) # {2, 4, 6}
# ⽅法⼆: 使⽤intersection⽅法
print(set1.intersection(set2)) # {2, 4, 6}
# 并集
# ⽅法⼀: 使⽤ | 运算符
print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
# ⽅法⼆: 使⽤union⽅法
print(set1.union(set2)) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
# 差集
# ⽅法⼀: 使⽤ - 运算符
print(set1 - set2) # {1, 3, 5, 7}
# ⽅法⼆: 使⽤difference⽅法
print(set1.difference(set2)) # {1, 3, 5, 7}
# 对称差
# ⽅法⼀: 使⽤ ^ 运算符
print(set1 ^ set2) # {1, 3, 5, 7, 8, 10}
# ⽅法⼆: 使⽤symmetric_difference⽅法
print(set1.symmetric_difference(set2)) # {1, 3, 5, 7, 8, 10}
# ⽅法三: 对称差相当于两个集合的并集减去交集
print((set1 | set2) - (set1 & set2)) # {1, 3, 5, 7, 8, 10}
通过上⾯的代码可以看出,对两个集合求交集, & 运算符和 intersection ⽅法的作⽤是完全相同的,使⽤运算符的⽅式更直观⽽且代码也⽐较简短。相信⼤家对交集、并集、差集、对称差这⼏个概念是⽐较清楚的,如果没什么印象了可以看看下⾯的图。

 集合的交集、并集、差集运算还可以跟赋值运算⼀起构成复合运算,如下所示。

set1 = {1, 3, 5, 7}
set2 = {2, 4, 6}
# 将set1和set2求并集再赋值给set1
# 也可以通过set1.update(set2)来实现
set1 |= set2
print(set1) # {1, 2, 3, 4, 5, 6, 7}
set3 = {3, 6, 9}
# 将set1和set3求交集再赋值给set1
# 也可以通过set1.intersection_update(set3)来实现
set1 &= set3
print(set1) # {3, 6}
⽐较运算
两个集合可以⽤ == != 进⾏相等性判断,如果两个集合中的元素完全相同,那么 == ⽐较的结果就是 True ,否则就是 False 。如果集合 A 的任意⼀个元素都是集合 B 的元素,那么集合 A 称为集合 B 的⼦集,即对于∀ a A ,均有 a B ,则 A B A B 的⼦集,反过来也可以称 B A 的超集。如果 A B 的⼦集且A不等于 B ,那么 A 就是 B 的真⼦集。 Python 为集合类型提供了判断⼦集和超集的运算符,其实就是我们⾮常熟悉的 < > 运算符,代码如下所示。
set1 = {1, 3, 5}
set2 = {1, 2, 3, 4, 5}
set3 = set2
# <运算符表示真⼦集,<=运算符表示⼦集
print(set1 < set2, set1 <= set2) # True True
print(set2 < set3, set2 <= set3) # False True
# 通过issubset⽅法也能进⾏⼦集判断
print(set1.issubset(set2)) # True
# 反过来可以⽤issuperset或>运算符进⾏超集判断
print(set2.issuperset(set1)) # True
print(set2 > set1) # True
集合的⽅法
Python 中的集合是可变类型,我们可以通过集合类型的⽅法为集合添加或删除元素。
# 创建⼀个空集合
set1 = set()
# 通过add⽅法添加元素
set1.add(33)
set1.add(55)
set1.update({1, 10, 100, 1000})
print(set1) # {33, 1, 100, 55, 1000, 10}
# 通过discard⽅法删除指定元素
set1.discard(100)
set1.discard(99)
print(set1) # {1, 10, 33, 55, 1000}
# 通过remove⽅法删除指定元素,建议先做成员运算再删除
# 否则元素如果不在集合中就会引发KeyError异常
if 10 in set1:
 set1.remove(10)
print(set1) # {33, 1, 55, 1000}
# pop⽅法可以从集合中随机删除⼀个元素并返回该元素
print(set1.pop())
# clear⽅法可以清空整个集合
set1.clear()
print(set1) # set()

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值