Python中字典的近亲——集合

集合的两个功能
1.集合可以实现去重的功能;
2.集合可以实现关系测试:交集,差集,并集,是否子集,是否没有交集

以一个应用场景来引出集合:
现在IPV4下用一个32位无符号整数来表示,一般用点分方式来显示,点将IP地址分成4个部
分,每个部分为8位,表示成一个无符号整数(因此不需要用正号出现),如10.137.17.1,
是我们非常熟悉的IP地址,一个IP地址串中没有空格出现(因为要表示成一个32数字)。
现在需要你用程序来判断IP是否合法。
(1)输入描述:输入一个ip地址
(2)输出描述:返回判断的结果YES or NO
示例1
1.输入: 10.138.15.1
2.输出: YES

#!/usr/bin/env python
#coding:utf-8

#172.25.254.1
ip = raw_input('ip:')
#["172"."25"."254"."1"]
ip = ip.split('.')
#一次判断每一部分是否合法;
for i in ip:
if 0<=int(i)<=255:
print 'YES'
break
else:
print 'NO'

场景1: li = ['a', 'b']
场景2: 社联要统计所有加入社团的学生?

li1 = ['a', 'b', 'c'] li2 = ['a', 'c']
all = []
for i in li1: for j in li2:
列表解决太麻烦;
set(li1 + li2) set(li1.extend(li2))

一.集合set的定义
1.集合是不重复的数据结构;
(1)花括号里面为空,是字典类型;
In [1]: s = {}

In [2]: type(s)
Out[2]: dict
Python中字典的近亲集合
(2)定义集合的第一种方式;
In [3]: s = {1, 2, 3, 1, 2}

In [4]: type(s)
Out[4]: set

In [5]: print s
set([1, 2, 3])
Python中字典的近亲集合
2.工厂方法定义集合时,括号里面是可迭代的对象, eg: 数值类型不可以;
(1)定义集合的第二种方式:定义一个空集合
In [6]: s = set()

In [7]: type(s)
Out[7]: set
Python中字典的近亲集合
(2)定义集合

*字符串
In [8]: s = set('hello')

In [9]: print s
set(['h', 'e', 'l', 'o'])
Python中字典的近亲集合
*字典
In [11]: s = set({'a':1, 'b':2, 'c':3})

In [12]: print s
set(['a', 'c', 'b'])
*元组
In [13]: s = set((1, 2, 3, 4))

In [14]: print s
set([1, 2, 3, 4])
*列表

In [15]: s = set([1, 2, 3])

In [16]: print s
set([1, 2, 3])
Python中字典的近亲集合
二.应用:实现列表去重

1,转换为集合数据类型:set(列表)
2.字典的fromkeys方法实现;
(1)实现列表去重
In [22]: li = [1, 2, 3, 4, 2, 3]

In [23]: s = set(li)

In [24]: li = list(s)

In [25]: print s
set([1, 2, 3, 4])
Python中字典的近亲集合
In [26]: print li
[1, 2, 3, 4]
(2)fromkeys方法实现列表去重
In [28]: li = [1, 2, 3, 4, 2, 3]

In [29]: d = {}.fromkeys(li)

In [30]: print d.keys()
[1, 2, 3, 4]
Python中字典的近亲集合
三.集合的特征

1.集合是无序的, 不重复的数据类型;
2.因此不支持索引,也不支持切片;也不支持重复;也不支持连接;
3.支持成员操作符;
4.支持for循环;

(1)成员操作符:
In [31]: s = {1, 2, 3, 4, 1, 2}

In [32]: 1 in s
Out[32]: True

In [33]: 1 not in s
Out[33]: False
Python中字典的近亲集合
(2)集合支持for循环,是可迭代的:
In [34]: for i in s:
....: print i
....: 
1
2
3
4
Python中字典的近亲集合

四.集合的增三改查

1.增

In [35]: s = {1, 2, 3, 4, 1, 2}

In [36]: s.add(8)

In [37]: s.add(1)

In [38]: print s
set([8, 1, 2, 3, 4])
Python中字典的近亲集合
In [39]: s1 = {'a', 'b', 'c'}

In [40]: s.update(s1)

In [41]: print s
set(['a', 1, 2, 3, 4, 8, 'c', 'b'])
Python中字典的近亲集合
2.改

3.查
关系测试操作

In [45]: s1 = {1, 2, 3, 4}

In [46]: s2 = {1, 2, 3, 5}
#交集
In [47]: s1 & s2
Out[47]: {1, 2, 3}
#并集
In [48]: s1 | s2
Out[48]: {1, 2, 3, 4, 5}
#差集
In [49]: s1 - s2
Out[49]: {4}

In [50]: s2 - s1
Out[50]: {5}

#对等差分
In [51]: s1 ^ s2
Out[51]: {4, 5}
Python中字典的近亲集合
#交集
In [52]: s1.intersection(s2)
Out[52]: {1, 2, 3}
#并集
In [53]: s1.union(s2)
Out[53]: {1, 2, 3, 4, 5}
Python中字典的近亲集合
#差集
In [54]: s1.difference(s2)
Out[54]: {4}

In [55]: s2.difference(s1)
Out[55]: {5}
Python中字典的近亲集合
#对等差分
In [56]: s1.symmetric_difference(s2)
Out[56]: {4, 5}
Python中字典的近亲集合
In [67]: s1 = {1, 2, 3, 4}

In [68]: s2 = {1, 2, 3}
#s2是否s1子集
In [69]: s2.issubset(s1)
Out[69]: True
#s1是否是s2的父集
In [71]: s1.issuperset(s2)
Out[71]: True

#是否没有交集
In [72]: s1.isdisjoint(s2)
Out[72]: False

4.删

In [73]: s = {1, 'a', 'hello', 45,}
(1)s.pop() #随机删除一个,返回一个对象
In [74]: s.pop()
Out[74]: 'a'
Python中字典的近亲集合
(2)s.remove #删除指定元素,是set成员则删除,不是成员报错
In [75]: s.remove(1)

In [76]: print s
set([45, 'hello'])

In [77]: s.remove(‘b’)
File "<ipython-input-77-fe0f6997b18b>", line 1
s.remove(‘b’)
^
SyntaxError: invalid syntax
Python中字典的近亲集合
In [78]: print s
set([45, 'hello'])
(3)s.discard() #删除指定元素,是成员删除,不是成员什么都不做
In [79]: s.discard(45)

In [80]: s.discard('b')

In [81]: print s
set(['hello'])
Python中字典的近亲集合
(4)s.clear() #清空集合元素
In [82]: s.clear()

In [83]: s
Out[83]: set()
Python中字典的近亲集合

应用:
(华为机试题)题目描述
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性, 他先用计算机生成了N个1到1000
之间的随机整数(N≤1000), N是用户输入的,对于 其中重复的数字,只保留一个,把其余相同的数去
掉,不同的数对应 着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺 序去找同学做调
查。请你协助明明完成“去重”与“排序”的工作;
提示:
生成随机数,
import random
random.randint(1,1000)
列表的去重

#!/usr/bin/env python
#coding:utf-8

import random
s = set()
N = input('输入一个数:')
for i in range (N) :
s.add(random.randint(1,1000))
#sorted是内置方法用来排序;
print sorted(s)
#li = list(s)
#li.sort()
#print li

总结
可变数据类型: 列表, 字典, 集合
不可变数据类型: 数值类型, 字符串, 元组
可变数据类型实现某个功能, 直接改变可变的数据类型;
不可变数据类型实现某个功能,需要将结果赋值给另外一个变量;
是否实现for循环
可迭代数据类型: str, list, tuple, dict, set
不可迭代数据类型:数值类型
是否支持索引,切片, 重复和连接特性
有序的数据类型: str, list, tuple
无序的数据类型: dict, set









本文转自Uniqueh51CTO博客,原文链接:http://blog.51cto.com/13363488/2059266 ,如需转载请自行联系原作者





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值