1.集合与字典简介
(1)集合
集合(set)是一个无序不重复元素的序列。
基本功能是进行成员关系测试和删除重复元素。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。(下面有详细介绍)
(2)字典
字典(dictionary)是Python中另一个非常有用的内置数据类型。
列表、元组都是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取(即可以通过索引来读取)。
字典是一种映射类型,字典用"{ }"标识,它是一个无序的键(key) : 值(value)对集合。键(key)必须使用不可变类型。在同一个字典中,键(key)必须是唯一的。
- 补充说明:映射类型
映射类型:
表示一个任意对象的集合,且可以通过另一个几乎是任意键值的集合进行索引
与序列不同,映射是无序的,通过键进行索引
任何不可变对象都可用作字典的键,如字符串、数字、元组等
包含可变对象的列表、字典和元组不能用作键
引用不存在的键会引发KeyError异常
2.列表、元组、字典与集合比较
在前面的博客中,介绍了列表与元组,现在我们从几个方面来对比他们的异同点
索引 | 分片 | 重复 | 连接 | 成员操作符 | 遍历 | |
---|---|---|---|---|---|---|
列表 | 能 | 能 | 能 | 能 | 能 | 能 |
元组 | 能 | 能 | 能 | 能 | 能 | 能 |
字符串 | 能 | 能 | 能 | 能 | 能 | 能 |
集合 | x | x | x | x | 能 | 能 |
字典 | x | x | x | x | 能 | 能 |
注意:在开篇我们说过集合与字典都是无序的,那么索引、分片就没有意义;且集合的功能之一就是去重,而字典是映射类型,Key是唯一的,同样重复与连接也就不支持
类型 | 功能 |
---|---|
列表 | 相当于一个数据仓库,可以存放各种类型的数据,如:a = [1,2,3] |
元组 | 元组和列表在结构上没有什么区别,唯一的差异在于元组是只读的,不能修改。如: a = (1,),注意:括号里的逗号不是手误,具体可参考前面关于元组的博客 |
集合 | 集合就是我们数学学的集合,没有什么特殊的定义。集合最好的应用是去重,如:a = {1,2,3}。集合没有特殊的表示方法,而是通过一个set函数转换成集合。 |
字典 | 字典存储键值对数据;字典最外面用大括号,每一组用冒号连起来,然后各组用逗号隔开;字典最大的价值是查询,通过键,查找值。 |
3.集合的具体用法
(1)集合的创建——set
定义一个集合:
好了,问题又来了:如何定义一个空集合呢?
s = {} ##这样吗?下图告诉你答案!
【dict】——类型为字典!(后面会讲),集合没有特殊的表示方法,而是通过一个set函数转换成集合。 应该如下定义:
(2)集合的特性只有成员操作符、遍历,这里就不做演示。下面重点说说集合的一些常用方法
定义一个新的集合
s = {6,7,8,9}
-
集合元素的增删
s.add(参数) s.update({2,3,5}) ##批量添加 s.pop() ##删除 s.remove(参数) ##删除指定元素
定义;两个新的集合
s1 = {1,2,3}
s2 = {2,3,4}
-
交集、并集、差集
print('并集:',s1.union(s2)) print('并集:',s1|s2) print('交集:',s1.intersection(s2)) print('交集:',s1&s2) print('差集:',s1.difference(s2)) print('差集:',s2.difference(s1))
-
对等差分:并集 - 交集
print('对等差分:',s1.symmetric_difference(s2)) print('对等差分:',s2.symmetric_difference(s1))
定义以下新的集合:
s3 = {1,2}
s4 = {1,2,3}
-
包含关系:两个集合之间一般有三种关系,相交、包含、不相交。在Python中分别用下面的方法判断:
-
set.isdisjoint(s):判断两个集合是否不相交
-
a.issuperset(b):判断集合是不是包含其他集合(即判断集合是否为超集,或者说父集),等同于a>=b
-
a.issubset(b):判断集合是不是被其他集合包含(即判断集合是否为子集),等同于a<=b
程序练习题:
华为机测题:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性他先用计算
机生成了N个1~1000之间的随机整数(N<=1000),N是用户输>入的,对于其中重
复的数字,只保留一个,把其余相同的数字去掉,不同的数对应着不同的学生的
号,然后再把这些数从小到大排序,按照排好的顺序去找同学做调查,请你协助
明明完成“去重”与排序工作
4.字典
(1)字典的定义
字典是一个无序的数据集合,使用print输出字典的时候,通常输出的顺序和定义的顺序是不一致的
定义一个空字典:
s = {}
定义一个非空字典:key - value 键值对,value可以是任意数据类型
利用工厂函数定义一个字典:
字典的嵌套:
快速定义一个所有value值一样的字典:
(2)字典的特性只有成员操作符、遍历(for循环遍历的是Key值),这里就不做演示。下面重点说说字典的一些常用方法
定义一个新的字典:
services = {
'http':80,
'ftp':21,
'ssh':22
}
-
字典元素的增加
方法一: 增加一个元素时,
如果key值存在,则更新对应的value值
如果key值不存在,则添加对应key-valuesetdefault添加key值
如果key值存在,不做修改
如果key值不存在,添加对应的key-value方法二: 添加多个元素
-
字典元素的删除
方法一:del
方法二:pop
pop删除指定key的key-value
如果key存在,删除,并返回删除key对应的value
如果不存在,报错
方法三:popitempopitem删除最后一个key-value值
. -
字典的清空
-
字典的查看,补充:get方法获取指定key对应的value
程序练习题:
重复的单词: 此处认为单词之间以空格为分隔符, 并且不包含,和.>;
# 1. 用户输入一句英文句子;
# 2. 打印出每个单词及其重复的次数;
“hello java hello python”
hello 2
java 1
python 1
数字重复统计:
1) 随机生成1000个整数
2) 数字范围[20,100]
3) 升序输出所有不同的数字及其每个数字的重复次数
写的丑,大概演示一下
运行结果如下:
思考题1:
思考题2: