Task 5：字典、集合、序列（Datawhale-Python学习笔记）

最新推荐文章于 2021-12-01 22:31:43 发布

鸡米花甜辣酱

最新推荐文章于 2021-12-01 22:31:43 发布

阅读量238

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_44936560/article/details/107672475

版权

Python 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

5.1 字典

5.1.1 可变与不可变类型

序列是以连续的整数为索引，与此不同的是，字典以"关键字"为索引，关键字可以是任意不可变类型，通常用字符串或数值。
字典是 Python 唯一的映射类型，字符串、元组、列表属于序列类型。

判断一个数据类型X是否可变类型有两种方法：

麻烦方法：用id(X)函数，对X进行某种操作，比较操作前后的id，如果不一样，则X不可变，如果一样，则X可变。
便捷方法：用hash(X)，只要不报错，证明X可被哈希，即不可变，反过来不可被哈希，即可变。

此外

数值、字符、元组都能被哈希，因此它们是不可变类型。
列表、集合、字典不能被哈希，因此它是可变类型。

5.1.2 字典的定义

字典是无序的键:值（key:value）对集合，键必须是互不相同的（在同一个字典之内）。

dict内部存放的顺序和key放入的顺序是没有关系的。
dict查找和插入的速度极快，不会随着key的增加而增加，但是需要占用大量的内存。

字典定义语法为 {元素1, 元素2, …, 元素n}

其中每一个元素是一个「键值对」 – 键:值 (key:value)
关键点是「大括号{}」,「逗号,」和「冒号:」
大括号 – 把所有元素绑在一起
逗号 – 将每个键值对分开
冒号 – 将键和值分开

字典的创建

dict()创建一个空的字典。
通过key直接把数据放入字典中，但一个key只能对应一个value，多次对一个key放入value，新值会替换掉旧值。
dict(mapping)可以通过映射对象的(key,value)对来创建字典

dic1 = dict([('apple', 4139), ('peach', 4127), ('cherry', 4098)])
print(dic1)  # {'cherry': 4098, 'apple': 4139, 'peach': 4127}

dic2 = dict((('apple', 4139), ('peach', 4127), ('cherry', 4098)))
print(dic2)  # {'peach': 4127, 'cherry': 4098, 'apple': 4139}

dict(**kwargs)可以通过key=value对创建字典。但此时，key只能为字符串类型。

dic = dict(name='Tom', age=10)
print(dic)  # {'name': 'Tom', 'age': 10}
print(type(dic))  # <class 'dict'>

4.1.3 字典的内置方法

方法	作用	说明
`dict.fromkeys(seq[, value])`	创建一个字典	以序列`seq`中元素做字典的键，`value`为字典所有键对应的初始值
`dict.keys()`	返回一个可迭代对象，包含`dict`中的所有`key`	可以使用 list() 来转换为列表，列表为字典中的所有键
`dict.values()`	返回一个可迭代对象，包含`dict`中的所有`value`	可以使用 list() 来转换为列表，列表为字典中的所有值
`dict.items()`	以列表返回可遍历的(`key`,`value`) 元组数组
`dict.get(key, default=None)`	返回指定`key`的`value`，如果`value`不在字典中返回默认值
`dict.setdefault(key, default=None)`	和`get()`方法类似如果`key`不存在于字典中，将会添加`key`并将`value`设为默认值
`key in dict`	`in`操作符用于判断`key`是否存在于字典中，如果键在字典`dict`里返回`True`，否则返回`False`	而`not in`操作符刚好相反，如果`key`在字典`dict`里返回`False`，否则返回`True`
`dict.pop(key[,default])`	弹出字典给定键 key 所对应的值，返回值为被弹出的值	key 值必须给出，若key不存在，则返回 default 值
`del dict[key]`	删除字典给定键 key 所对应的值
`dict.popitem()`	随机返回并删除字典中的一对键和值	如果字典已经为空，却调用了此方法，就报出KeyError异常
`dict.clear()`	用于删除字典内所有元素
`dict.copy()`	返回一个字典的浅复制
`dict.update(dict2)`	把字典参数`dict2`的`key:value`键值对更新到字典`dict`里

练习题：
1、字典基本操作

字典内容如下:

dic = {
    'python': 95,
    'java': 99,
    'c': 100
    }

用程序解答下面的题目

字典的长度是多少
请修改’java’ 这个key对应的value值为98
删除 c 这个key
增加一个key-value对，key值为 php, value是90
获取所有的key值，存储在列表里
获取所有的value值，存储在列表里
判断 javascript 是否在字典中
获得字典里所有value 的和
获取字典里最大的value
获取字典里最小的value
字典 dic1 = {‘php’: 97}，将dic1的数据更新到dic中

print(len(dic)) #3

dic['java']=98
print(dic) #{'python': 95, 'java': 98, 'c': 100}

dic['php']=90
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 90}

Keys = list(dic.keys())
print(Keys) #['python', 'java', 'c', 'php']

Values = list(dic.values())
print(Values) #[95, 98, 100, 90]

print('javascript' in dic) #False

print(sum(Values)) #383

print(max(Values)) #100

print(min(Values)) #90

dic1 = {'php':97}
dic.update(dic1)
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 97}

2、字典中的value

有一个字典，保存的是学生各个编程语言的成绩，内容如下

data = {
        'python': {'上学期': '90', '下学期': '95'},
        'c++': ['95', '96', '97'],
        'java': [{'月考':'90', '期中考试': '94', '期末考试': '98'}]
        }

各门课程的考试成绩存储方式并不相同，有的用字典，有的用列表，但是分数都是字符串类型，请实现函数transfer_score(score_dict)，将分数修改成int类型。

5.2 集合

Python中set与dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以在set中，没有重复的key。

5.2.1 集合的创建

创建空集合
向空集合加入元素

创建空集合只能使用set()函数，此外set()可以直接将列表或元组转换为集合。
.add(obj)方法加入元素
重复元素会被自动过滤
直接把一堆元素用花括号括起来{元素1, 元素2, ..., 元素n}

由于set存储的是无序集合，所以我们不可以为集合创建索引或执行切片(slice)操作，也没有键(key)可用来获取集合中元素的值，但是可以判断一个元素是否在集合中。

tip：去掉列表中的重复元素，可以直接将列表转换为集合，再转换回列表。

5.2.2 集合的内置方法

方法	作用	说明
`set.add(elmnt)`	向集合加入元素	若集合中已存在该元素，则集合不改变
`set.update(set1)`	向集合加入元素或集合	若集合中已存在某一元素，则该元素会被自动过滤
`set.discard(value)`	移除指定的集合元素	`set.remove()`在移除一个不存在的元素时回发生错位，而`set.discard()`不会
`set.pop()`	随机弹出一个元素
`set1.intersection(set2)`	返回`set1`和`set2`的交集
`set1 & set2`	返回`set1`和`set2`的交集
`set1.intersection_update(set2)`	返回`set1`和`set2`的交集	移除`set1`中不重叠的元素
`set1.union(set2)`	返回`set1`和`set2`的并集
`set1 \| set2`	返回`set1`和`set2`的并集
`set1.difference(set2)`	返回`set1`和`set2`的差集
`set1 - set2`	返回`set1`和`set2`的差集
`set1.difference_update(set2)`	`set1`和`set2`的差集	直接在`set1`集合中移除元素，没有返回值
`set1.symmetric_difference(set2)`	返回集合的异或
`set1 ^ set2`	返回集合的异或
`set1.symmetric_difference_update(set2)`	移除`set1`中在`set2`相同的元素，并将`set2`中不同的元素插入到`set1`中
`set1.issubset(set2)`	判断`set1`是否是`set2`的子集	如果是则返回 `True`，否则返回`False`
`set1 <= set2`	判断`set1`是否是`set2`的子集	如果是则返回 `True`，否则返回`False`
`set1.isdisjoint(set2)`	判断两个集合是否不相交	如果是返回`True`，否则返回`False`

5.2.3 不可变集合

Python提供了不能改变元素的集合的实现版本，即不能增加或删除元素，类型名叫frozenset。需要注意的是frozenset仍然可以进行集合操作，只是不能用带有update()的方法。

frozenset([iterable])返回一个冻结的集合，冻结后集合不能再添加或删除任何元素。

练习题：

怎么表示只包含⼀个数字1的元组。

a = tuple([1])

print(a,type(a)) #(1,) <class 'tuple'>

创建一个空集合，增加 {‘x’,‘y’,‘z’} 三个元素。

a = set()
a.update({'x','y','z'})

print(a,type(a)) #{'y', 'x', 'z'} <class 'set'>

列表[‘A’, ‘B’, ‘A’, ‘B’]去重。

a = ['A', 'B', 'A', 'B']
a = list(set(a))

print(a,type(a)) #['B', 'A'] <class 'list'>

求两个集合{6, 7, 8}，{7, 8, 9}中不重复的元素（差集指的是两个集合交集外的部分）。

a = {6,7,8}
b = {7,8,9}

a ^ b  # {6, 9}
a.symmetric_difference(b) #{6, 9}

求{‘A’, ‘B’, ‘C’}中元素在 {‘B’, ‘C’, ‘D’}中出现的次数。

a = {'A', 'B', 'C'}
b = {'B', 'C', 'D'}

c = list(a&b)
d = list(a - b)

for i in range(len(c)):
    print("集合 a 中的 %s 在%s中出现了1次"%(c[i],b))

for i in range(len(d)):
    print("集合 a 中的 %s 在%s中出现了0次"%(d[i],b))

#集合a中的 B 在{'D', 'B', 'C'}中出现了1次
#集合a中的 C 在{'D', 'B', 'C'}中出现了1次
#集合a中的 A 在{'D', 'B', 'C'}中出现了0次

5.3 序列

在 Python 中，序列类型包括字符串、列表、元组、集合和字典，这些序列支持一些通用的操作。
但比较特殊的是，集合和字典不支持索引、切片、相加和相乘操作。

方法	作用	说明
`list(sub)`	把一个可迭代对象转换为列表
`tuple(sub)`	把一个可迭代对象转换为元组
`str(obj)`	把obj对象转换为字符串
`len(obj)`	返回对象（字符、列表、元组等）长度或元素个数
`max(sub)`	返回序列或者参数集合中的最大值
`min(sub)`	返回序列或参数集合中的最小值
`sum(iterable[, start=0])`	返回序列iterable与可选参数start的总和
`sorted(iterable, key=None, reverse=False)`	对所有可迭代的对象进行排序操作
`reversed(seq)`	函数返回一个反转的迭代器
`enumerate(sequence, [start=0])`	用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标	一般用在 for 循环当中
`zip(iter1 [,iter2 [...]])`	用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存	如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用`*`操作符，可以将元组解压为列表

练习题：

怎么找出序列中的最大、小值？
答：seq.max()和seq.min()
sort() 和 sorted() 区别
答：sort()是方法，sorted()是函数，两者作用相同。
怎么快速求 1 到 100 所有整数相加之和？
答：sum(range(100))
求列表 [2,3,4,5] 中每个元素的立方根。

import numpy as np
a = [2,3,4,5]
list(np.sqrt(a))

将[‘x’,‘y’,‘z’] 和 [1,2,3] 转成 [(‘x’,1),(‘y’,2),(‘z’,3)] 的形式。

a = ['x','y','z'] 
b = [1,2,3]
c = []
for i in range(len(a)):
    d = [a[i],b[i]]
    c.append(tuple(d))
print(c)
#[('x', 1), ('y', 2), ('z', 3)]

鸡米花甜辣酱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Task 5：字典、集合、序列（Datawhale-Python学习笔记）

5.1 字典5.1.1 可变与不可变类型序列是以连续的整数为索引，与此不同的是，字典以"关键字"为索引，关键字可以是任意不可变类型，通常用字符串或数值。字典是 Python 唯一的映射类型，字符串、元组、列表属于序列类型。判断一个数据类型X是否可变类型有两种方法：麻烦方法：用id(X)函数，对X进行某种操作，比较操作前后的id，如果不一样，则X不可变，如果一样，则X可变。便捷方法：用hash(X)，只要不报错，证明X可被哈希，即不可变，反过来不可被哈希，即可变。此外数值、字符、元组
复制链接

扫一扫

专栏目录