python集合类型_Python对象类型之集合

intumu.com:机器学习(ML)、人工智能(AI)和土木工程的(TM)关系?​zhuanlan.zhihu.comv2-c142a86d80e95b2dd586234b8f25e399_180x120.jpg

前言

着手开始写的时候就一直有一个画面在脑子中出现:小猪佩奇第N级,猪爸爸拿出来一本《混凝土的故事》,打开书的时候说道:混凝土是由砂子、水、水泥组成的,结果其他人都睡着了。于是,我在想,要是给土木人讲:python万法皆对象,对象类型有:数字:int,long,float,complex,bool

字符:str,unicod

列表:list

字典:dict

元组:tuple

文件:file

其他类型:集合(set),冻结集合(frozenset),类类型等。

是不是也有人睡着?相反,如果我直接说砂子、水泥、钢筋、混凝土,是不是觉得亲切?所以接下来将会从一砖一瓦的建筑材料说Python。

万法皆对象:在基建领域,你所看到的构筑物就是有以上提到的基础建材组成;在Python领域对象类型就可以看做基础建筑材料,然后由不同的施工工艺产生不同的单体模块或构造物。例如:一个函数(施工工艺)所包含的参数(基础建材),形成一个伪代码。

伪代码

#围墙条形基础开挖

变量类型:铲子、䦆头、羊角碾、块石、砖头、水泥、混凝土

#工艺流程:

开挖条形基坑

夯实基础

抛填块片石

混凝土填充找平

砌砖

#以上即为面向过程编程,下面先说说数字类型。

真代码

集合

之前看到的列表和字符串都是一种有序序列,而集合 set 是一种无序的序列。

因为集合是无序的,所以当集合中存在两个同样的元素的时候,Python只会保存其中的一个(唯一性);同时为了确保其中不包含同样的元素,集合中放入的元素只能是不可变的对象(确定性)。

集合生成

可以用set()函数来显示的生成空集合:

a = set()

type(a)

set

也可以使用一个列表来初始化一个集合:

a = set([1, 2, 3, 1])

a

{1, 2, 3}

集合会自动去除重复元素 1。

可以看到,集合中的元素是用大括号{}包含起来的,这意味着可以用{}的形式来创建集合:

a = {1, 2, 3, 1}

a

{1, 2, 3}

但是创建空集合的时候只能用set来创建,因为在Python中{}创建的是一个空的字典:

s = {}

type(s)

dict

集合操作

假设有这样两个集合:

a = {1, 2, 3, 4}

b = {3, 4, 5, 6}

两个集合的并,返回包含两个集合所有元素的集合(去除重复)。

可以用方法 a.union(b) 或者操作 a | b 实现。

a.union(b)

{1, 2, 3, 4, 5, 6}

b.union(a)

{1, 2, 3, 4, 5, 6}

a | b

{1, 2, 3, 4, 5, 6}

两个集合的交,返回包含两个集合共有元素的集合。

可以用方法 a.intersection(b) 或者操作 a & b 实现。

a.intersection(b)

{3, 4}

b.intersection(a)

{3, 4}

a & b

{3, 4}

print(a & b)

set([3, 4])

注意:一般使用print打印set的结果与表示方法并不一致。

a 和 b 的差集,返回只在 a 不在 b 的元素组成的集合。

可以用方法 a.difference(b) 或者操作 a - b 实现。

a.difference(b)

{1, 2}

a - b

{1, 2}

注意,a - b 与 b - a并不一样,b - a 返回的是返回 b 不在 a 的元素组成的集合:

b.difference(a)

{5, 6}

b - a

{5, 6}

对称差

a 和b 的对称差集,返回在 a 或在 b 中,但是不同时在 a 和 b 中的元素组成的集合。

可以用方法 a.symmetric_difference(b) 或者操作 a ^ b 实现(异或操作符)。

a.symmetric_difference(b)

{1, 2, 5, 6}

b.symmetric_difference(a)

{1, 2, 5, 6}

a ^ b

{1, 2, 5, 6}

包含关系

假设现在有这样两个集合:

a = {1, 2, 3}

b = {1, 2}

要判断 b 是不是 a 的子集,可以用 b.issubset(a) 方法,或者更简单的用操作 b <= a :

b.issubset(a)

True

b <= a

True

与之对应,也可以用 a.issuperset(b) 或者 a >= b 来判断:

a.issuperset(b)

True

a >= b

True

方法只能用来测试子集,但是操作符可以用来判断真子集:

a <= a

True

自己不是自己的真子集:

a < a

False

集合方法

add 方法向集合添加单个元素

跟列表的 append 方法类似,用来向集合添加单个元素。

s.add(a)

将元素 a 加入集合 s 中。

t = {1, 2, 3}

t.add(5)

t

{1, 2, 3, 5}

如果添加的是已有元素,集合不改变:

t.add(3)

t

{1, 2, 3, 5}

update 方法向集合添加多个元素

跟列表的extend方法类似,用来向集合添加多个元素。

s.update(seq)

将seq中的元素添加到s中。

t.update([5, 6, 7])

t

{1, 2, 3, 5, 6, 7}

remove 方法移除单个元素

s.remove(ob)

从集合s中移除元素ob,如果不存在会报错。

t.remove(1)

t

{2, 3, 5, 6, 7}

t.remove(10)

---------------------------------------------------------------------------

KeyError Traceback (most recent call last)

in ()

----> 1 t.remove(10)

KeyError: 10

pop方法弹出元素

由于集合没有顺序,不能像列表一样按照位置弹出元素,所以pop 方法删除并返回集合中任意一个元素,如果集合中没有元素会报错。

t.pop()

{3, 5, 6, 7}

print(t)

set([3, 5, 6, 7])

s = set()

# 报错

s.pop()

---------------------------------------------------------------------------

KeyError Traceback (most recent call last)

in ()

1 s = set()

2 # 报错

----> 3 s.pop()

KeyError: 'pop from an empty set'

discard 方法

作用与 remove 一样,但是当元素在集合中不存在的时候不会报错。

t.discard(3)

t

{5, 6, 7}

不存在的元素不会报错:

t.discard(20)

t

{5, 6, 7}

difference_update方法

a.difference_update(b)

从a中去除所有属于b的元素:

土木狗的视角:集合大体上是列表+字典+元组的变种!集合是无序的,所以当集合中存在两个同样的元素的时候,Python只会保存其中的一个(唯一性);同时为了确保其中不包含同样的元素,集合中放入的元素只能是不可变的对象(确定性)。这个特性往往可以用在处理列表的重复数据,比如一个含有重复数据的listA,可以通过list(set(listA))进行强制转换类型,进而实现去重。

课后作业(可选)

按上一节运行自己的项目,新建一个*.ipynb文件,将上面代码敲入运行。

intumu.com:Python数据分析及可视化实例目录​zhuanlan.zhihu.comv2-7c8705fee90c16eaf1ecbcf45417a813_180x120.jpg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值