Python数据结构（三）set使用和原理

最新推荐文章于 2023-04-25 14:40:21 发布

Mr番茄蛋

最新推荐文章于 2023-04-25 14:40:21 发布

阅读量5.4k

点赞数 3

分类专栏： python

本文链接：https://blog.csdn.net/qq_35203425/article/details/100774387

版权

python 专栏收录该内容

86 篇文章 6 订阅

订阅专栏

1. set是什么？

数学上，把set称做由不同的元素组成的集合，集合（set）的成员通常被称做集合元素（set elements）。Python把这个概念引入到它的集合类型对象里。集合对象是一组无序排列的可哈希的值。集合关系测试和union、intersection等操作符在Python里也同样如我们所预想地那样工作。

2. set特点

集合中的元素有三个特征：

确定性：集合中的元素必须是确定的；
互异性：集合中的元素互不相同，如：集合A={1，a}，则a不能等于1）；
无序性：集合中的元素没有先后之分，如：{3,4,5}和{3,5,4}算作同一个集合。

python中集合（set）是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素，还可以计算交集、差集、并集等。它与列表(list)的行为类似，区别在于set不能包含重复的值，而且set元素是无序的。

在python中可以用大括号 {} 创建集合。注意：如果要创建或初始化一个空集合，你必须用 set() 而不是 {} 。因为后者{} 作为创建一个空的字典，以后我们会介绍字典这种数据结构。

3. python集合种类

python集合有两种不同的类型：

可变集合(set)：可变集合(set)，可以添加和删除元素，
不可变集合(frozenset)：不可变集合(frozenset)一旦创建就不允许更改。

根据上面两种集合可知，set是可变对象，因此既不能用做字典的键也不能做其他集合中的元素。frozenset则正好相反，它是不可变对象（这点类似python中的tuple），即它们有哈希值，能被用做字典的键或是作为集合中的一个成员。

注意： 上面我们说 set 是可变对象，不可哈希，是指创建的整个对象，而不是指对象中某个元素，这一点可以类比list和tuple区别。

4. 创建set

创建空集合

s1 = set()  # 创建空集合
print(s1)  # 打印空集合不是{} 而是set()，是为了和空字典区分
print(type(s1))
# set()
# <class 'set'>

d = {}  # 这个是创建空字典，注意区别
print(d, type(d))
# {} <class 'dict'>

创建可变集合set

s1 = {2, 1, 3}
print(s1)  # 下面输出结果看出，集合是无序的
# {1, 2, 3}

s2 = {1, 2, 3, 3}  # 虽然加入的元素有重复，但是集合自动去重
print(s2)
# {1, 2, 3}

# 使用工厂创建集合，但是注意参数是可迭代的
s3 = set('12aa')
print(s3)
# {'1', '2', 'a'}

s4 = set([1, 2, 'a', 'a'])
print(s4)
# {1, 2, 'a'}

3.创建不可变集合frozenset

s1 = frozenset('12aa')
print(s1)
# frozenset({'2', 'a', '1'})

s2 = frozenset([1, 2, 'a', 'a'])
print(s2)
# frozenset({1, 2, 'a'})

【创建集合讨论】
根据上面代码，我们发现，创建空集合只能用set() ，不能用{} 。而且非空集合打印结果是由 {} 包裹起来的，前面我们学元组（tuple），它的打印结果是由 () 包裹起来的。另外有第二段代码可以看出集合是无序的，通过set() 可以把其他数据结构转换为集合，而且自动去重。

5. 集合遍历和访问

循环遍历：

# 集合遍历使用for
s1 = {5, 4, 3, 2, 1}
for x in s1:
    print(x, end=" ")
# 1 2 3 4 5

集合没有索引，不能使用索引获取对应元素，比如使用s[1] 会报错，想想为什么？

s1={1,2,3}
print(s1[1])
#     print(s1[1])
# TypeError: 'set' object does not support indexing

上面代码可以看到使用索引获取元素报错，根本原因是集合是无序的，不可hash。

6. 集合的交并补运算

数学符号	Python符号	含义
- 或\| -	差集，相对补集
∩	&	交集
∪	\|	并集
≠	!=	不等于
＝	==	等于
∈	in	是成员关系
∉	not in	非成员关系

例子

s1 = {1, 2, 3, 4, 5}
s2 = {4, 5, 6, 7, 8}

print(s1 - s2)  # 差集
# {1, 2, 3}
print(s2 - s1)
# {8, 6, 7}
print(s1 & s2)  # 交集
# {4, 5}
print(s1 | s2)  # 并集
# {1, 2, 3, 4, 5, 6, 7, 8}
print(s1 ^ s2)  # 交叉补集
# {1, 2, 3, 6, 7, 8}

print(6 in s1)
# False
print(6 not in s1)
# True

7. 操作集合的函数

len(set)：集合元素个数
max(set)：返回集合元素最大值
min(set)：返回集合元素最小值
list(set)：将集合转换为列表
del：删除集合，释放内存空间

8. 集合类定义的函数

方法	描述
add()	为集合添加元素
update()	给集合添加元素
clear()	移除集合中的所有元素
copy()	拷贝一个集合
pop()	随机移除元素
remove()	移除指定元素
discard()	删除集合中指定的元素
isdisjoint()	判断两个集合是否包含相同的元素，如果没有返回 True，否则返回 False。
issubset()	判断指定集合是否为该方法参数集合的子集。
issuperset()	判断该方法的参数集合是否为指定集合的子集
symmetric_difference()	返回两个集合中不重复的元素集合。
symmetric_difference_update()	移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。
union()	返回两个集合的并集，等同于 \|
difference()	返回多个集合的差集，等同于 -
difference_update()	移除集合中的元素，该元素在指定的集合也存在。
intersection()	返回集合的交集
intersection_update()	返回集合的交集。

例子

s1 = {1, 2, 3}
s1.add(4)
s1.add(3)  # 添加重复元素，自动去重
print(s1)
# {1, 2, 3, 4}

s2 = {3, 4, 5}
s1.update(s2)
print(s1)
# {1, 2, 3, 4, 5}

s1.remove(1)
print(s1)
# {2, 3, 4, 5}

9. 集合各种操作时间复杂度

操作	平均情况	最坏情况
x in s	O(1)	O(n)
并集 s\|t	O(len(s)+len(t))
交集 s&t	O(min(len(s), len(t))	O(len(s) * len(t))
差集 s-t	O(len(s))
s.difference_update(t)	O(len(t))
对称差集 s^t	O(len(s))	O(len(s) * len(t))
s.symmetric_difference_update(t)	O(len(t))	O(len(t) * len(s))