一. 基本用法
set类似于list, 区别在于set不包含重复的值。这在很多情况下非常有用。例如你可能想检查列表中是否包含重复的元素, 你有两个选择, 第一个需要使用for循环, 就像这样:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:
if some_list.count(value) > 1:
if value not in duplicates:
duplicates.append(value)
print(duplicates)
# 输出: ['b', 'n']
但还有一种更简单更优雅的解决方案, 那就是使用set, 如:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
你也可以用符号{ }来创建集合, 如:
a_set = {‘red’, ‘blue’, ‘green’}
print(type(a_set))
输出:
二. 集合操作
1. 交集
对比两个集合的交集(两个集合中都有的数据), 如下:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
# 输出: set(['red'])
2. 差集
你可以用差集(difference)找出无效的数据, 相当于用一个集合减去另一个集合的数据, 例如:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
# 输出: set(['brown'])