正文: 734字
预计阅读时间: 2分钟
set
set 是 “集合” 在 Python 实现,它是可修改的,但不保证元素顺序。一些常用的场景:
一个值是否属于一个集合;
任意序列的去重;
集合的交、并、差操作等。
set 的实现可以看作是空 value 的字典,比如 {‘key1’ :’’, ‘key2’:’’},这就要求 set 的元素必须是可 hash 的,不能是那些可变容器,比如 list,dict 之类,但 tuple 是不可变容器,可以作为 set 的成员。
set 的比较条件是:两个集合的所有元素都相同。集合元素的比较是通过 == 操作或者调用元素的 __eq__ 方法,而非 X is Y 的形式。由于 set 是可修改的,所以它无法生成 hash,这不满足 set 成员的要求,所以不存在 set in a set。
frozenset
set 的元素都是可 hash 的,但 set 本身不可 hash,主要是因为 set 的元素可能增删,这会使之前生成的 hash 失效。
一种解决方案是将 set 转换为 frozenset。frozenset 一旦创建就不允许修改其成员了,这样就保证了集合成员的确定性,那么它的 hash 可以简单的将所有成员 hash 累加起来得到。
这样 frozenset 就可以作为另一个 set 的成员,或者字典的 key 了。
set 和 frozenset 的关系有点类似 list 和 tuple 之间的关系,在读写权限上有一些差异。
转化和比较
set 和 frozenset 的转化非常直接——利用初始化方法,创建相应的副本。并且,set 和 frozenset 可以比较,只要所有成员都相同即相等。
s = {1,2,3}# set -> frozensetfs = frozenset(s)# frozenset -> setss = set(fs)fs == s # Truefs == ss # Truess == s # True
点击查看更多,打开官方文档。