今天介绍基础教程里最后一个数据结构set,也叫集合。
1、概念理解和基础用法
对于集合这个概念,你应该不会陌生,毕竟这玩意高中的数学课上就讲过,如果你都还给老师了,我可以帮你回忆一下。对于集合,我们只需要掌握一点即可,集合里没有重复的元素。
就算你向集合中刻意的添加许多相同的元素,最终,集合里对同一个元素也只保留一个,而不是多个,放多少存多少个的那是list。
1.1 创建一个空集合
myset = set()
1.2 将一个list转成集合
#coding=utf-8
myset = set([1,3,4,5,6,1,3,4])
for item in myset:
print item
1.3 添加新元素
myset.add(4)
1.4 删除一个元素
myset.remove(4)
如果被删除的元素不存在,会引发错误
1.5 判断元素是否在集合中
if 3 in myset:
print 'exist'
2、实际应用
上面的操作都是极为简单的,使用集合,通常是利用set中元素不能重复的特点来进行排重,比如我从一份文件中读取了许多水果的名字,这些名字都存储在了一个list中,内容如下:
fruit_lst = ['apple','orange','banana','pear','apple',
'orange','orange','pear']
现在,让你统计一共有多少种水果,分别是什么,你就可以用set来做
2.1 示例代码:
#coding=utf-8
fruit_set = set()
fruit_lst = ['apple','orange','banana','pear','apple','orange','orange','pear']
for item in fruit_lst:
fruit_set.add(item)
print u'一共有{count}类水果'.format(count=len(fruit_set))
for item in fruit_set:
print item
通过这个简单的例子,你会发现,len函数也可以作用于集合,不仅如此,还有max和min函数,此外,你还学习到了如何遍历集合。
如果足够细心,你会发现,如果仅仅是为了排重,字典也是可以胜任的,因为字典里的key也没有重复的,没错,这种想法是可行的,还是上面的例子,可以改成字典来做
2.2示例代码:
#coding=utf-8
fruit_dict = {}
fruit_lst = ['apple','orange','banana','pear','apple',
'orange','orange','pear']
for item in fruit_lst:
fruit_dict[item] = 1
print u'一共有{count}类水果'.format(count=len(fruit_dict))
for item in fruit_dict.keys():
print item
字典的keys()方法,此前我没有讲过,今天直接拿出来使用,只看名字你应该已经猜出他的作用了,这个方法返回一个list,里面是字典的所有的key。
学习要能举一反三,大胆去猜测然后小心的求证,看到keys()方法,你应该想到或许还有一个叫values()的方法,去验证一下吧。
2.3 根据问题来选择用谁
实际工作中,遇到这类问题,通常我不会用字典来解决,因为完全没有必要,仅仅是统计水果的种类而已,何必要多出一个value呢?
但如果题目稍作变化,改为统计水果的种类并且计算出每种水果出现的次数就不一样了,这时,value就有了存在的必要,我以水果种类做key,以出现次数做value,这样,既能统计出水果的种类,也可以统计出各种水果出现的次数。
#coding=utf-8
fruit_dict = {}
fruit_lst = ['apple','orange','banana','pear','apple',
'orange','orange','pear']
for item in fruit_lst:
if not item in fruit_dict:
fruit_dict[item] = 0
fruit_dict[item] += 1
print u'一共有{count}类水果'.format(count=len(fruit_dict))
for k,v in fruit_dict.items():
print k,v
3、集合间的操作
还有三个非常重要的方法,作用于两个集合之间
3.1 合并两个set
set1 = set([1,2,3])
set2 = set([2,3,4])
print set1.union(set2)
3.2 求交集
set1 = set([1,2,3])
set2 = set([2,3,4])
print set1.intersection(set2)
3.3 求差集
set1 = set([1,2,3])
set2 = set([2,3,4])
print set1.difference(set2)
如你所见,我所讲的内容并没有超出你的能力范围,事实上,如果你对知识锱铢必较,每一个知识点都理解清楚掌握扎实,越往后,学起来越轻松,渐渐的,你开始习惯编程的思维,稍加刻意练习,就可以融会贯通了。