集合的两个功能:
- 集合可以实现去重的功能;
- 集合可以实现关系测试; 交集, 差集,并集, 是否子集, 是否没有交集……..
前菜
现在IPV4下用一个32位无符号整数来表示,一般用点分方式来显示,点将IP地址分成4个部分,每个部分为8位,表示成一个无符号整数(因此不需要用正号出现),如10.137.17.1,是我们非常熟悉的IP地址,一个IP地址串中没有空格出现(因为要表示成一个32数字)。现在需要你用程序来判断IP是否合法。
- 输入描述:输入一个ip地址
- 输出描述:返回判断的结果YES or NO
示例1
- 输入: 10.138.15.1
- 输出: YES
4 ip = raw_input("ip:")
5 if len(ip.split(".")) != 4:
6 print "NO"
7 else:
8 for i in ip.split("."):
9 if not 0<=int(i)<=255:
10 print "NO"
11 exit()
12 print "YES"
集合set的定义{}
- 集合是不重复的数据结构;
# 如果花括号里面为空,则是字典类型;
s = {}
print type(s)
<type 'dict'>
# 定义集合的第一种方式 ;
s = {1, 2, 3, 2, 3}
print type(s)
<type 'set'>
工厂方法定义集合时, 括号里面是可迭代的对象, eg: 数值类型不可以;
# 定义集合的第二种方式 ; 定义一个空的集合;
s = set()
print type(s)
<type 'set'>
s = set('hello')
print s
{'e', 'h', 'l', 'o'}
s = set((1,2,3,4,5))
print s
{1, 2, 3, 4, 5}
s = set({'a':1,'b':2})
print s
{'a', 'b'}
s = set([1,2,3])
print s
{1, 2, 3}
应用: 如何实现列表去重?
- 转换为集合数据类型; set(列表)
- 字典的fromkeys方法实现;
# 实现列表去重 1 :
li = [1, 2, 3, 4, 1, 2]
s = set(li) #转换为集合数据类型
print s
{1, 2, 3, 4}
# 实现列表去重 2 :
li = [1, 2, 3, 4, 1, 2]
d = {}.fromkeys(li) #字典的fromkeys方法
print d.keys()
[1, 2, 3, 4]
集合的特性
- 集合是无序的, 不重复的数据类型;
- 因此不支持索引,也不支持切片;也不支持重复;也不支持连接;
- 支持成员操作符; 支持for循环;
s = {1, 2, 3, 4, 1, 2}
print 1 in s
True
print 2 not in s
False
# 集合支持 for 循环,是可迭代的;
s = {1, 2, 3, 4}
for i in s:
print i
1
2
3
4
集合的增删改查
增
s = {1, 2, 3, 4, 1, 2}
print s
{1, 2, 3, 4}
s.add(1)
{1, 2, 3, 4}
s.add(7)
{1, 2, 3, 4, 7}
s.update(s1)
print s
{1, 2, 3, 4, 7, 'a', 'b', 'c'}
# 集合不支持重复;也不支持连接
查- (关系测试操作)
s1 = {1, 2, 3, 4}
s2 = {1, 2, 3, 5}
# 交集
s1 & s2
s1.intersection(s2)
s1.intersection_update(s2)
{1, 2, 3}
# 并集
s1 | s2
s1.union(s2)
{1, 2, 3, 4, 5}
# 差集
s1 - s2
s1.difference(s2)
{4}
# 对等差分
s1 ^ s2
s1.symmetric_difference(s2)
{4, 5}
s1.issubset(s2) ##s1是否是s2的子集
s1.issuperset(s2) ##s1是否为s2的父集
s1.isdisjoint(s2) ##s1是否不是s2
删
s = {'alice','hello', 'westos', 'b', 18, 2, 33, 4, 1, 2, 7, 6, 5}
s.pop()不能带任何参数,随机删除一个元素
print s.pop()
1
s.remove删除集合指定元素, 如果不存在,则报错;
s = {'alice','hello', 'westos', 'b', 18}
s.remove('alice')
s.discard删除集合指定元素, 如果不存在,do nothing;
In [38]: s = {'alice','hello', 'westos', 'b', 18}
s.discard("a")
s.clear清空集合元素
s.clear()
print s
set([])
应用:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性, 他先用计算机生成了N个1到1000之间的随机整数(N≤1000), N是用户输入的,对于 其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应 着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺 序去找同学做调查。请你协助明明完成“去重”与“排序”的工作;
提示:
- 生成随机数,
- import random
- random.randint(1,1000)
- 列表的去重
3 import random
4 s = set()
5 N = input("N:")
6 for i in range(N):
7 num = random.randint(1,1000)
8 s.add(num)
9 out = list(s)
10 out.sort()
11 print out
import random
s = set()
N = input('输入一个数')
for i in range (N) :
s.add(random.randint(1,1000))
# sorted 是内置方法, 用来排序;
print sorted(s)
# li = list(s)
# li.sort()
# print li
总结
可变数据类型: 列表, 字典, 集合
不可变数据类型: 数值类型, 字符串, 元组
- 可变数据类型实现某个功能, 直接改变可变的数据类型;
- 不可变数据类型实现某个功能,需要将结果赋值给另外一个变量;
是否实现for循环
- 可迭代数据类型: str, list, tuple, dict, set
- 不可迭代数据类型:数值类型
是否支持索引,切片, 重复和连接特性
- 有序的数据类型: str, list, tuple
- 无序的数据类型: dict, set