python的set和其他语言类似, 是一个无序不重复元素集。基本功能:关系测试、消除重复元素。
集合对象还支持union(并), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算。
set类型支持 x in set, len(set),和 for x in set。作为一个无序的集合,set不记录元素位置或者插入点。因此,set不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。
消除重复元素,示例:
>>> x=[1,1,5,6,4,4,2,7,7,9]
>>> set(x)
set([1, 2, 4, 5, 6, 7, 9])
>>> y='HelloWorld'
>>> set(y)
set(['e', 'd', 'H', 'l', 'o', 'r', 'W'])
关系测试,示例2:
>>> str1=set('china')
>>> str2=set(['a','s','i','a'])
>>> str1 & str2 #交集
set(['a', 'i'])
>>> str1 | str2 #并集
set(['a', 'c', 'i', 'h', 'n', 's'])
>>> str1 - str2 #差集
set(['h', 'c', 'n'])
去除列表里海量重复元素,可以用hash来解决,只不过性能上不是很高。推荐使用set来处理,可以先转换成set,然后再转回list。示例3:
>>> m = ['11','22','33','44','11','22']
>>> n = set(m)
>>> n
set(['11', '33', '44', '22'])
>>> p = [i for i in n]
>>> p
['11', '33', '44', '22']