set 拥有类似 dict 的特点:可以用{}花括号来定义;其中的元素没有序列,也就是是非序列类型的数据;而且,set 中的元素不可重复,这就类似 dict 的键.
set 也有一点 list 的特点:有一种集合可以原处修改.
下面通过实验,进一步理解创建 set 的方法:
>>> s1 = set("qiwsir")
>>> s1
set(['q', 'i', 's', 'r', 'w'])
把 str 中的字符拆解开,形成 set.特别注意观察:qiwsir 中有两个 i,但是在 s1 中,只有一个 i,也就是集合中元素不能重复。
>>> s2 = set([123,"google","face","book","facebook","book"])
>>> s2
set(['facebook', 123, 'google', 'book', 'face'])
在创建集合的时候,如果发现了重复的元素,就会过滤一下,剩下不重复的。而且,从 s2 的创建可以看出,查看结果是显示的元素顺序排列与开始建立是不同,完全是随意显示的,这说明集合中的元素没有序列。
>>> s3 = {"facebook",123} #通过{}直接创建 >>> s3 set([123, 'facebook'])
然后用 help()可以找到每个函数的具体使用方法,下面列几个例子:
add, update
>>> help(set.add) Help on method_descriptor: add(...) Add an element to a set. This has no effect if the element is already present.
下面在交互模式这个最好的实验室里面做实验:
>>> a_set = {} #我想当然地认为这样也可以建立一个 set >>> a_set.add("qiwsir") #报错.看看错误信息,居然告诉我 dict 没有 add.我分明建立的是 set 呀. Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'dict' object has no attribute 'add' >>> type(a_set) #type 之后发现,计算机认为我建立的是一个 dict <type 'dict'>
特别说明一下,{}这个东西,在 dict 和 set 中都用.但是,如上面的方法建立的是 dict,不是 set.这是 Python 规定的.要建立 set,只能用前面介绍的方法了.
>>> a_set = {'a','i'} #这回就是 set 了吧 >>> type(a_set) <type 'set'> #果然 >>> a_set.add("qiwsir") #增加一个元素 >>> a_set #原处修改,即原来的 a_set 引用对象已经改变 set(['i', 'a', 'qiwsir']) >>> b_set = set("python") >>> type(b_set) <type 'set'> >>> b_set set(['h', 'o', 'n', 'p', 't', 'y']) >>> b_set.add("qiwsir") >>> b_set set(['h', 'o', 'n', 'p', 't', 'qiwsir', 'y']) >>> b_set.add([1,2,3]) #报错.list 是不可哈希的,集合中的元素应该是 hashable 类型。 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: 'list' >>> b_set.add('[1,2,3]') #可以这样! >>> b_set set(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir', 'y'])
除了上面的增加元素方法之外,还能够从另外一个 set 中合并过来元素,方法是 set.update(s2)
>>> help(set.update) update(...) Update a set with the union of itself and others. >>> s1 set(['a', 'b']) >>> s2 set(['github', 'qiwsir']) >>> s1.update(s2) #把 s2 的元素并入到 s1 中. >>> s1 #s1 的引用对象修改 set(['a', 'qiwsir', 'b', 'github']) >>> s2 #s2 的未变 set(['github', 'qiwsir'])
pop, remove, discard, clear
>>> help(set.pop) pop(...) Remove and return an arbitrary set element. Raises KeyError if the set is empty. >>> b_set set(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir', 'y']) >>> b_set.pop() #从 set 中任意选一个删除,并返回该值 '[1,2,3]' >>> b_set.pop() 'h' >>> b_set.pop() 'o' >>> b_set set(['n', 'p', 't', 'qiwsir', 'y']) >>> b_set.pop("n") #如果要指定删除某个元素,报错了. Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: pop() takes no arguments (1 given)
set.pop()是从 set 中任意选一个元素,删除并将这个值返回.但是,不能指定删除某个元素.报错信息中就告诉我们了,pop()不能有参数.此外,如果 set 是空的了,也报错.这条是帮助信息告诉我们的,看官可以试试.
要删除指定的元素,怎么办?
>>> help(set.remove) remove(...) Remove an element from a set; it must be a member. If the element is not a member, raise a KeyError.
set.remove(obj)
中的 obj,必须是 set 中的元素,否则就报错.试一试:>>> a_set set(['i', 'a', 'qiwsir']) >>> a_set.remove("i") >>> a_set set(['a', 'qiwsir']) >>> a_set.remove("w") Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'w'
跟 remove(obj)类似的还有一个 discard(obj):
>>> help(set.discard) discard(...) Remove an element from a set if it is a member. If the element is not a member, do nothing.
与
help(set.remove)
的信息对比,看看有什么不同.discard(obj)中的 obj 如果是 set 中的元素,就删除,如果不是,就什么也不做,do nothing.新闻就要对比着看才有意思呢.这里也一样.>>> a_set.discard('a') >>> a_set set(['qiwsir']) >>> a_set.discard('b') >>>
在删除上还有一个绝杀,就是 set.clear(),它的功能是:Remove all elements from this set.(看官自己在交互模式下 help(set.clear))
>>> a_set set(['qiwsir']) >>> a_set.clear() >>> a_set set([]) >>> bool(a_set) #空了,bool 一下返回 False. False
集合运算
唤醒一下中学数学(准确说是高中数学中的一点知识)中关于集合的一点知识,当然,你如果是某个理工科的专业大学毕业,更应该熟悉集合之间的关系。
元素与集合的关系
就一种关系,要么术语某个集合,要么不属于。
>>> aset set(['h', 'o', 'n', 'p', 't', 'y']) >>> "a" in aset False >>> "h" in aset True
集合与集合的关系
假设两个集合 A、B
- A 是否等于 B,即两个集合的元素完全一样
在交互模式下实验
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a == b
False
>>> a != b
True
- A 是否是 B 的子集,或者反过来,B 是否是 A 的超集。即 A 的元素也都是 B 的元素,但是 B 的元素比 A 的元素数量多。
判断集合 A 是否是集合 B 的子集,可以使用 A<B
,返回 true 则是子集,否则不是。另外,还可以使用函数 A.issubset(B)
判断。
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> c
set(['q', 'i'])
>>> c<a #c 是 a 的子集
True
>>> c.issubset(a) #或者用这种方法,判断 c 是否是 a 的子集
True
>>> a.issuperset(c) #判断 a 是否是 c 的超集
True
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a<b #a 不是 b 的子集
False
>>> a.issubset(b) #或者这样做
False
- A、B 的并集,即 A、B 所有元素,如下图所示
可以使用的符号是“|”,是一个半角状态写的竖线,输入方法是在英文状态下,按下"shift"加上右方括号右边的那个键。找找吧。表达式是 A | B
.也可使用函数 A.union(B)
,得到的结果就是两个集合并集,注意,这个结果是新生成的一个对象,不是将结合 A 扩充。
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a | b #可以有两种方式,结果一样
set(['a', 'i', 'l', 'o', 'q', 's', 'r', 'w'])
>>> a.union(b)
set(['a', 'i', 'l', 'o', 'q', 's', 'r', 'w'])
- A、B 的交集,即 A、B 所公有的元素,如下图所示
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a & b #两种方式,等价
set(['q', 'i'])
>>> a.intersection(b)
set(['q', 'i'])
我在实验的时候,顺手敲了下面的代码,出现的结果如下,看官能解释一下吗?(思考题)
>>> a and b
set(['a', 'q', 'i', 'l', 'o'])
- A 相对 B 的差(补),即 A 相对 B 不同的部分元素,如下图所示
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a - b
set(['s', 'r', 'w'])
>>> a.difference(b)
set(['s', 'r', 'w'])
-A、B 的对称差集,如下图所示
>>> a
set(['q', 'i', 's', 'r', 'w'])
>>> b
set(['a', 'q', 'i', 'l', 'o'])
>>> a.symmetric_difference(b)
set(['a', 'l', 'o', 's', 'r', 'w'])
以上是集合的基本运算。在编程中,如果用到,可以用前面说的方法查找。不用死记硬背。