5.1 字典
5.1.1 可变与不可变类型
- 序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。
- 字典是 Python 唯一的映射类型,字符串、元组、列表属于序列类型。
判断一个数据类型X
是否可变类型有两种方法:
- 麻烦方法:用
id(X)
函数,对X
进行某种操作,比较操作前后的id
,如果不一样,则X
不可变,如果一样,则X
可变。 - 便捷方法:用
hash(X)
,只要不报错,证明X
可被哈希,即不可变,反过来不可被哈希,即可变。
此外
- 数值、字符、元组都能被哈希,因此它们是不可变类型。
- 列表、集合、字典不能被哈希,因此它是可变类型。
5.1.2 字典的定义
字典是无序的键:值(key:value
)对集合,键必须是互不相同的(在同一个字典之内)。
dict
内部存放的顺序和key
放入的顺序是没有关系的。dict
查找和插入的速度极快,不会随着key
的增加而增加,但是需要占用大量的内存。
字典定义语法为 {元素1, 元素2, …, 元素n}
- 其中每一个元素是一个「键值对」 – 键:值 (
key:value
) - 关键点是「大括号
{}
」,「逗号,
」和「冒号:
」 - 大括号 – 把所有元素绑在一起
- 逗号 – 将每个键值对分开
- 冒号 – 将键和值分开
字典的创建
dict()
创建一个空的字典。- 通过
key
直接把数据放入字典中,但一个key
只能对应一个value
,多次对一个key
放入value
,新值会替换掉旧值。 dict(mapping)
可以通过映射对象的(key,value)
对来创建字典
dic1 = dict([('apple', 4139), ('peach', 4127), ('cherry', 4098)])
print(dic1) # {'cherry': 4098, 'apple': 4139, 'peach': 4127}
dic2 = dict((('apple', 4139), ('peach', 4127), ('cherry', 4098)))
print(dic2) # {'peach': 4127, 'cherry': 4098, 'apple': 4139}
dict(**kwargs)
可以通过key=value
对创建字典。但此时,key
只能为字符串类型。
dic = dict(name='Tom', age=10)
print(dic) # {'name': 'Tom', 'age': 10}
print(type(dic)) # <class 'dict'>
4.1.3 字典的内置方法
方法 | 作用 | 说明 |
---|---|---|
dict.fromkeys(seq[, value]) | 创建一个字典 | 以序列seq 中元素做字典的键,value 为字典所有键对应的初始值 |
dict.keys() | 返回一个可迭代对象,包含dict 中的所有key | 可以使用 list() 来转换为列表,列表为字典中的所有键 |
dict.values() | 返回一个可迭代对象,包含dict 中的所有value | 可以使用 list() 来转换为列表,列表为字典中的所有值 |
dict.items() | 以列表返回可遍历的(key ,value ) 元组数组 | |
dict.get(key, default=None) | 返回指定key 的value ,如果value 不在字典中返回默认值 | |
dict.setdefault(key, default=None) | 和get() 方法类似 如果key 不存在于字典中,将会添加key 并将value 设为默认值 | |
key in dict | in 操作符用于判断key 是否存在于字典中,如果键在字典dict 里返回True ,否则返回False | 而not in 操作符刚好相反,如果key 在字典dict 里返回False ,否则返回True |
dict.pop(key[,default]) | 弹出字典给定键 key 所对应的值,返回值为被弹出的值 | key 值必须给出,若key不存在,则返回 default 值 |
del dict[key] | 删除字典给定键 key 所对应的值 | |
dict.popitem() | 随机返回并删除字典中的一对键和值 | 如果字典已经为空,却调用了此方法,就报出KeyError异常 |
dict.clear() | 用于删除字典内所有元素 | |
dict.copy() | 返回一个字典的浅复制 | |
dict.update(dict2) | 把字典参数dict2 的key:value 键值对更新到字典dict 里 |
练习题:
1、字典基本操作
字典内容如下:
dic = {
'python': 95,
'java': 99,
'c': 100
}
用程序解答下面的题目
- 字典的长度是多少
- 请修改’java’ 这个key对应的value值为98
- 删除 c 这个key
- 增加一个key-value对,key值为 php, value是90
- 获取所有的key值,存储在列表里
- 获取所有的value值,存储在列表里
- 判断 javascript 是否在字典中
- 获得字典里所有value 的和
- 获取字典里最大的value
- 获取字典里最小的value
- 字典 dic1 = {‘php’: 97}, 将dic1的数据更新到dic中
print(len(dic)) #3
dic['java']=98
print(dic) #{'python': 95, 'java': 98, 'c': 100}
dic['php']=90
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 90}
Keys = list(dic.keys())
print(Keys) #['python', 'java', 'c', 'php']
Values = list(dic.values())
print(Values) #[95, 98, 100, 90]
print('javascript' in dic) #False
print(sum(Values)) #383
print(max(Values)) #100
print(min(Values)) #90
dic1 = {'php':97}
dic.update(dic1)
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 97}
2、字典中的value
有一个字典,保存的是学生各个编程语言的成绩,内容如下
data = {
'python': {'上学期': '90', '下学期': '95'},
'c++': ['95', '96', '97'],
'java': [{'月考':'90', '期中考试': '94', '期末考试': '98'}]
}
各门课程的考试成绩存储方式并不相同,有的用字典,有的用列表,但是分数都是字符串类型,请实现函数transfer_score(score_dict)
,将分数修改成int
类型。
5.2 集合
Python中set
与dict
类似,也是一组key
的集合,但不存储value
。由于key
不能重复,所以在set
中,没有重复的key
。
5.2.1 集合的创建
- 创建空集合
- 向空集合加入元素
- 创建空集合只能使用
set()
函数,此外set()
可以直接将列表或元组转换为集合。 .add(obj)
方法加入元素- 重复元素会被自动过滤
- 直接把一堆元素用花括号括起来
{元素1, 元素2, ..., 元素n}
由于set
存储的是无序集合,所以我们不可以为集合创建索引或执行切片(slice)操作,也没有键(key
)可用来获取集合中元素的值,但是可以判断一个元素是否在集合中。
- tip:去掉列表中的重复元素,可以直接将列表转换为集合,再转换回列表。
5.2.2 集合的内置方法
方法 | 作用 | 说明 |
---|---|---|
set.add(elmnt) | 向集合加入元素 | 若集合中已存在该元素,则集合不改变 |
set.update(set1) | 向集合加入元素或集合 | 若集合中已存在某一元素,则该元素会被自动过滤 |
set.discard(value) | 移除指定的集合元素 | set.remove() 在移除一个不存在的元素时回发生错位,而set.discard() 不会 |
set.pop() | 随机弹出一个元素 | |
set1.intersection(set2) | 返回set1 和set2 的交集 | |
set1 & set2 | 返回set1 和set2 的交集 | |
set1.intersection_update(set2) | 返回set1 和set2 的交集 | 移除set1 中不重叠的元素 |
set1.union(set2) | 返回set1 和set2 的并集 | |
set1 | set2 | 返回set1 和set2 的并集 | |
set1.difference(set2) | 返回set1 和set2 的差集 | |
set1 - set2 | 返回set1 和set2 的差集 | |
set1.difference_update(set2) | set1 和set2 的差集 | 直接在set1 集合中移除元素,没有返回值 |
set1.symmetric_difference(set2) | 返回集合的异或 | |
set1 ^ set2 | 返回集合的异或 | |
set1.symmetric_difference_update(set2) | 移除set1 中在set2 相同的元素,并将set2 中不同的元素插入到set1 中 | |
set1.issubset(set2) | 判断set1 是否是set2 的子集 | 如果是则返回 True ,否则返回False |
set1 <= set2 | 判断set1 是否是set2 的子集 | 如果是则返回 True ,否则返回False |
set1.isdisjoint(set2) | 判断两个集合是否不相交 | 如果是返回True ,否则返回False |
5.2.3 不可变集合
Python提供了不能改变元素的集合的实现版本,即不能增加或删除元素,类型名叫frozenset
。需要注意的是frozenset
仍然可以进行集合操作,只是不能用带有update()
的方法。
frozenset([iterable])
返回一个冻结的集合,冻结后集合不能再添加或删除任何元素。
练习题:
- 怎么表示只包含⼀个数字1的元组。
a = tuple([1])
print(a,type(a)) #(1,) <class 'tuple'>
- 创建一个空集合,增加 {‘x’,‘y’,‘z’} 三个元素。
a = set()
a.update({'x','y','z'})
print(a,type(a)) #{'y', 'x', 'z'} <class 'set'>
- 列表[‘A’, ‘B’, ‘A’, ‘B’]去重。
a = ['A', 'B', 'A', 'B']
a = list(set(a))
print(a,type(a)) #['B', 'A'] <class 'list'>
- 求两个集合{6, 7, 8},{7, 8, 9}中不重复的元素(差集指的是两个集合交集外的部分)。
a = {6,7,8}
b = {7,8,9}
a ^ b # {6, 9}
a.symmetric_difference(b) #{6, 9}
- 求{‘A’, ‘B’, ‘C’}中元素在 {‘B’, ‘C’, ‘D’}中出现的次数。
a = {'A', 'B', 'C'}
b = {'B', 'C', 'D'}
c = list(a&b)
d = list(a - b)
for i in range(len(c)):
print("集合 a 中的 %s 在%s中出现了1次"%(c[i],b))
for i in range(len(d)):
print("集合 a 中的 %s 在%s中出现了0次"%(d[i],b))
#集合a中的 B 在{'D', 'B', 'C'}中出现了1次
#集合a中的 C 在{'D', 'B', 'C'}中出现了1次
#集合a中的 A 在{'D', 'B', 'C'}中出现了0次
5.3 序列
- 在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作。
- 但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。
方法 | 作用 | 说明 |
---|---|---|
list(sub) | 把一个可迭代对象转换为列表 | |
tuple(sub) | 把一个可迭代对象转换为元组 | |
str(obj) | 把obj对象转换为字符串 | |
len(obj) | 返回对象(字符、列表、元组等)长度或元素个数 | |
max(sub) | 返回序列或者参数集合中的最大值 | |
min(sub) | 返回序列或参数集合中的最小值 | |
sum(iterable[, start=0]) | 返回序列iterable与可选参数start的总和 | |
sorted(iterable, key=None, reverse=False) | 对所有可迭代的对象进行排序操作 | |
reversed(seq) | 函数返回一个反转的迭代器 | |
enumerate(sequence, [start=0]) | 用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标 | 一般用在 for 循环当中 |
zip(iter1 [,iter2 [...]]) | 用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存 | 如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用* 操作符,可以将元组解压为列表 |
练习题:
- 怎么找出序列中的最大、小值?
答:seq.max()
和seq.min()
- sort() 和 sorted() 区别
答:sort()
是方法,sorted()
是函数,两者作用相同。 - 怎么快速求 1 到 100 所有整数相加之和?
答:sum(range(100))
- 求列表 [2,3,4,5] 中每个元素的立方根。
import numpy as np
a = [2,3,4,5]
list(np.sqrt(a))
- 将[‘x’,‘y’,‘z’] 和 [1,2,3] 转成 [(‘x’,1),(‘y’,2),(‘z’,3)] 的形式。
a = ['x','y','z']
b = [1,2,3]
c = []
for i in range(len(a)):
d = [a[i],b[i]]
c.append(tuple(d))
print(c)
#[('x', 1), ('y', 2), ('z', 3)]