1.什么是集合
- 集合(set)是Python的一种基本数据类型;
- 集合是一个无序的不可重复元素序列,集合是可变的。
- 集合的元素必须是可以hash类型的;
- 集合不可以使用索引访问,因为set无序,但是可以被迭代;
- 可以hash类型:数值类型,布尔类型,字符串类型,bytes,元组,None等;
- 不可以hash类型:list, bytearray, set等;
2.集合的定义
s = set()
s = {}
s = {1,2,3}
s1 = {(1,2,3),100,'abc'} 元组是可以被hash的,所以可以作为集合的元素
print(s1)
s2 = {[1,2,3],(1,2,3),100} 列表是不可hash的,所以输出会报错
print(s2) 报错
s3 = set([1,2,3,4])
print(s3)
如果你依然在编程的世界里迷茫,
不知道自己的未来规划,
对python感兴趣,
这里推荐一下我的学习交流圈QQ群:895 797 751,
里面都是学习python的,
- 定义一个集合的语法是:s = set(),而直接s = {}是定义一个空字典的语法;
- 集合的初始化可以直接在中括号{}中赋值,类似与:s = {1,2,3};
- 使用{}定义的集合,是集合的最终形式,所以不能有不可hash元素;
- 使用set()方法和update()方法是可以传入列表的,因为python程序会把这个列表自动转换为集合,所以,你会发现通过set([1,2,3]),输出的时候就会变成了{1,2,3}这样的,就是把列表合并成了一个集合;
3.集合的插入
s = set()
s.add(1)
s.add(1)
print(s) 输出:{1} 集合可以去重
- 集合的插入方法是 add() 方法;
- 集合中的元素是不可重复的,有去重功能;
4.集合的修改
s = set()
s.update([1,2,3])
print(s) 输出:{1, 2, 3}
如果你依然在编程的世界里迷茫,
不知道自己的未来规划,
对python感兴趣,
这里推荐一下我的学习交流圈QQ群:895 797 751,
里面都是学习python的,
- 集合的的修改方法是 update() 方法,可以修改集合中的元素;
5.集合的查询
s = {1,2,3,4}
for item in s:
print(item)
输出:
1
2
3
4
- 集合是无序的,不能使用 index 索引查询,所以只能用迭代来查询;
6.集合的删除
s = {1,2,3,4,5}
s.remove(1)
print(s)
s.discard(6)
print(s)
s.pop()
print(s)
s.clear()
print(s)
- remove:remove(value)方法直接移除元素的某个值,如果元素不存在,remove方法会报错;
- discard: discard方法与remove方法类似,不同在于如果元素不存在,discard不会报错;
- pop:一般来说集合中pop()方法是随机删除元素的,如果集合为空则报异常;
- clear:清除集合中所有元素;
7.集合的对象操作
- 并集:两个集合求并集可以使用union()方法,或者使用 | 符号连接两个集合(多个元素则可以使用update()方法);
s1 = {1,2,3,4}
s2 = {3,4,5,6}
s3 = {1,5,7,8}
如果你依然在编程的世界里迷茫,
不知道自己的未来规划,
对python感兴趣,
这里推荐一下我的学习交流圈QQ群:895 797 751,
里面都是学习python的,
sets = s1.union(s2)
print(sets)
sets = s1 | s2 | s3
print(sets)
- 交集:两个集合求交集可以使用intersection()方法(多个集合可以使用intersection_update()方法);
s1 = {1,2,3,4}
s2 = {3,4,5,6}
s3 = {4,5,6,7}
sets = s1.intersection(s2)
print(sets)
s1.intersection_update(*(s2,s3))
print(s1)
- 差集:两个集合求差集可以使用difference方法,例如s1.difference(s2)表示s1有但s2没有的元素,反之亦然(多个集合用difference_update()方法)
s1 = {1,2,3,4}
s2 = {3,4,5,6}
s3 = {5,6,7,8}
sets = s1.difference(s2)
print(sets)
s1.difference_update(*(s2,s3))
print(s1)
如果你依然在编程的世界里迷茫,
不知道自己的未来规划,
对python感兴趣,
这里推荐一下我的学习交流圈QQ群:895 797 751,
里面都是学习python的,
8.集合查询效率问题
- 线性结构的查询时间复杂度是O(n), 随着数据元素的增多,那么查询的时间线性增长;
- Python中的set、dict可以认为是非线性结构,那么查询时候的时间复杂度就不是O(n),其存储结构采用的是散列表(hash表),其在最优情况下查询复杂度为O(1);
- 所以集合查找时并不会随着元素集的增大而时间变长;