参考
Note: 更多连载请查看【python】
文章目录
集合元素的特点
- 元素的确定性
- 元素的互异性
- 元素的无序性
集合和字典一样,里面的顺序是无序的,也就是说 {1,2,3} 和 {3,2,1} 是相等的,集合的元素不可重复,也就是说:{1,2,3,3} 是不存在的 ,应该写为 {1,2,3},集合里的元素需要是不可变类型,可以使用数值,字符串,元组而不能使用列表,字典当做元素值,和字典中的键一样。所以集合可以理解为,只有键没有值的字典。
1 集合的创建
1.1 直接用大括号 {} 创建
1)集合元素是不可变类型所以可以使用数值,字符串,元组,而不能使用列表,字典当做元素值
note:
a = {}
a的类型为字典
set1 = {1,2,3,4,5}#直接使用大括号{}创建
print(set1)
print(type(set1))
set2 = {1,2.33,'Python',(1,'b')}
print(set2)
print(type(set2))
output
{1, 2, 3, 4, 5}
<class 'set'>
{1, 2.33, (1, 'b'), 'Python'}
<class 'set'>
2)如果你创建时在集合中写了重复的值,不会报错,但根据互异性,只会保存一个:
set3 = {1,2,2,3,4}#如果你创建时在集合中写了重复的值,不会报错,但根据互异性,只会保存一个
output
{1, 2, 3, 4}
1.2 用 set() 创建空集合
set4 = set()#创建空集合
set4
output
set()
1.3 使用列表或者元组创建
set5 = set([1,2,3,4,5,6])#使用列表或者元组创建,在set()里放入list或者tuple可以创建集合,该集合的元素就是列表或元组的元素
print (set5)
set6 = set((1,2,3,4,5))
print (set6)
output
{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5}
1.4 使用字符串创建
使用字符串创建,得到的集合的元素是字符串的每个字符
set7 = set('Python, I love you')#使用字符串创建,得到的集合的元素是字符串的每个字符
set7
output
{' ', ',', 'I', 'P', 'e', 'h', 'l', 'n', 'o', 't', 'u', 'v', 'y'}
空格,逗号都是元素
2 集合的方法
就像列表、字典、元组一样,集合的操作也有很多方法
add()
set.add(x)
,向集合中添加元素x
set8 = {1,2,3,4,5}
set8.add('a')#向集合中添加元素a
set8
output
{1, 2, 3, 4, 5, 'a'}
add 不能添加两个单个元素
set8 = {1,2,3,4,5}
set8.add(['a','b'])#向集合中添加元素a
set8
output
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-6-20f78e046522> in <module>()
1 set8 = {1,2,3,4,5}
----> 2 set8.add(['a','b'])#向集合中添加元素a
3 set8
TypeError: unhashable type: 'list'
元组可以整体加进来,因为 set 支持类型为 tuple 的元素
set8 = {1,2,3,4,5}
set8.add(('a','b'))#向集合中添加元素a
set8
output
{1, 2, 3, 4, 5, ('a', 'b')}
update()
set.update(a_set)
,使用集合 a_set
更新原集合,就是把括号里的集合的元素给 set
set9 = {'b','c'}
set8.update(set9)#使用集合set9更新原集合,就是把set9集合的元素给set8
set8
output
{1, 2, 3, 4, 5, 'a', 'b', 'c'}
pop()
set.pop( ),删除并且返回集合中的任意元素
set8 = {1, 2, 3, 4, 5, 'a', 'b', 'c'}
set8.pop()#删除并且返回集合中的任意元素
print (set8)
set8.pop()#这里的删除是不能指定删除谁的,和列表的不一样
print (set8)
output
{2, 3, 4, 5, 'b', 'c', 'a'}
{3, 4, 5, 'b', 'c', 'a'}
Note:列表中默认删除的是最后一个元素,字典中可以删除指定键值对,集合中是随机删除的
remove()
删除集合中的元素x,如果x不存在就报错
set8 = {3, 4, 5, 'b', 'c', 'a'}
a = set8.remove(3)#删除集合中的元素3,如果3不存在就报错
print(a)
print(set8)
output
None
{4, 5, 'c', 'a', 'b'}
返回的是 none,
set8.remove(1)
结果报错
KeyError: 1
discard()
set.discard(x),删除集合中的元素x,如果x不存在则什么也不做
set8 = {4, 5, 'b', 'c', 'a'}
a = set8.discard(1)#删除集合中的元素1,如果1不存在则什么也不做
print(a)
print(set8)
b = set8.discard(4)
print(b)
print(set8)
output
None
{4, 5, 'c', 'a', 'b'}
None
{5, 'c', 'a', 'b'}
clear()
set.clear( ),清空集合中的所有元素
set8 = {4, 5, 'a', 'b', 'c'}
set8.clear()#清空集合中的所有元素
set8
output
set()
frozenset()
不可改变的集合
a = frozenset([1,2,3,4,5])
a.add(6)
output
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-14-8885e73d326f> in <module>()
1 a = frozenset([1,2,3,4,5])
----> 2 a.add(6)
AttributeError: 'frozenset' object has no attribute 'add'
3 集合的数学运算(交并差)
说到集合,怎么可以少了这种经典的文氏图呢!
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print (set1.intersection(set2)) #求交集
print (set1.union(set2)) #求并集
print (set1.difference(set2)) #作差
output
{4, 5}
{1, 2, 3, 4, 5, 6, 7, 8}
{1, 2, 3}
还有更简洁的表达方式
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 & set2)
print(set1 | set2)
print(set1 - set2)
output
{4, 5}
{1, 2, 3, 4, 5, 6, 7, 8}
{1, 2, 3}
4 Demos
判断元素是否在集合中
set1 = {1, 2, 3, 4, 5}
print (1 in set1)#判断元素是否在集合中
print (10 in set1)
output
True
False
判断 set2 是否是 set1 的子集
set1 = {1,2,3,4,5}
set2 = {1,2,3}
print (set2.issubset(set1)) #判断set2是否是set1的子集
set3 = {0,1,2}
print (set3.issubset(set1))
output
True
False
如果你希望创建的集合是不变的,应该怎么做?
frozenset() 返回一个冻结的集合,冻结后集合不能再添加或删除任何元素。
解释下 set1 = {[1, 2]} 报错的原因
TypeError: unhashable type: ‘list’
从报错信息上我们看到“列表不是可哈希类型”,没错,列表是可变的,它怎么可以哈希呢?!咦,等等,这句话好像在那听过……呃,敢情集合跟字典的存储方式一样的丫!
其实你再想想就会觉得很有道理,利用哈希函数计算,相同的元素得到的哈希值(存放地址)是相同的,所以在集合中所有相同的元素都会覆盖掉,因此有了集合的唯一性。
然后你继续接着想就觉得更有道理了,通过哈希函数计算的地址不可能是按顺序排放的,所以集合才强调是无序的!
set1 = {(1, 2)}
则不报错
预测下 set2 = set([1,1.0]) 的结果
没错, 集合内容是 {1}
,其实你弄懂了上一题,这一题一样容易:因为在Python的哈希函数会将相同的值的元素计算得到相同的地址,所以1和1.0是等值的 ^_^
查找出现次数最多的元素
def most_frequent(list):
return max(set(list), key=list.count)
mylist = [1,1,2,3,4,5,6,6,2,2]
print("出现次数最多的元素是:", most_frequent(mylist))
output
出现次数最多的元素是: 2
删除列表中的重复项
list1 = [1,1,2,2,3,4,5]
print(list(set(list1)))
output
[1, 2, 3, 4, 5]
集合推导式
list1 = [1, 2, 3, 4, 5, 2, 5, 1, 4, 8]
set1 = { x for x in list1 if x % 2 == 0 }
print(set1)
print(type(set1))
output
{8, 2, 4}
<class 'set'>
Note: 更多连载请查看【python】