1.集合基本概念
集合是0-n个对象引用的无序组合,集合中存储的元素不可重复,因此这些对象引用的引用的对象必须是可哈希运算的 。
1.python中提供了两种内置的集合类型:可变的set
类型和固定的frozenset
类型。
2.只有可哈希运算的对象可以添加到集合中,因为集合是无序的,不能存储重复数据项;
3.可哈希运算的对象包含一个__hash__()
方法,该方法返回值在整个对象的生命周期都是相同的,可以使用__eq__()
方法进行比较。
4.所有内置的固定数据类型都是可哈希运算的,比如:int,float,str,tuple,所有内置的可变的数据类型都是不可进行哈希运算的,比如:dict,list,set.
5.集合中不存储重复元组,每一项都是唯一的。
2.set集合
set类型是可变的无序序列,因此可以进行添加、移除数据,同时由于是无序的组合类型,因此没有索引位置 ,故不能使用分片操作符进行操作。
2.1.set的创建
1.创建set类型时,使用{}进行创建,如:
>>> s1 = {
"java","12",12}
>>> s1
{
'12', 12, 'java'}
str、int都是内置不可变的数据类型,因此可以存储在set集合中,如果存储list类型的数据项呢?
>>> l1 = [1,2,3]
>>> s1 = {
"java",12,l1}
Traceback (most recent call last):
File "<pyshell#633>", line 1, in <module>
s1 = {
"java",12,l1}
TypeError: unhashable type: 'list'
这里报TypeError异常,原因是list是可变类型,没有hash()方法,不能进行哈希运算,因此 不能存储在set中。
2.使用set()创建集合,set()将返回一个空集合:
>>> s = set()
>>> s
set()
>>>
set()中传入一个set参数时,将返回该set的浅拷贝:
>>> s = set(s1)
>>> s
{
'12', 12, 'java'}
>>>
set()中如果传入其他任意对象,则尝试将给定的对象转换为集合:
>>> s = set("set list")
>>> s
{
' ', 's', 'l', 't', 'e', 'i'}
>>>
注意:创建空集合时,只能必须用set().不能使用s = {“ss”,1}这种形式,原因是这种形式用于创建另一种数据类型dict.
3.使用集合内涵创建(单独总结)
2.2.常用操作符和方法:
<,>,<=,>=,==,!=
:比较运算符,逐项进行比较,如果有嵌套,则递归比较;
如:
>>> s1 = set("1234")
>>> s2 = set("2134")
>>> s1
{
'2', '3', '1', '4'}
>>> s2
{
'2', '3', '1', '4'}
>>>
>>> s1 == s2
True
>>>
in、not in
:成员关系符:
>>> "2" in s2
True
>>>
内置len()
方法:
>>> len(s1)
4
>>>
集合操作符:|,&,-,^
,
|
:并集
>>> s1 = set("man")
>>> s2 = set("woman")
>>> s1 | s2
{
'o', 'n', 'a', 'w', 'm'}
>>>
&