Task 5:字典、集合、序列(Datawhale-Python学习笔记)

5.1 字典

5.1.1 可变与不可变类型

  • 序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。
  • 字典是 Python 唯一的映射类型,字符串、元组、列表属于序列类型。

判断一个数据类型X是否可变类型有两种方法:

  • 麻烦方法:用id(X)函数,对X进行某种操作,比较操作前后的id,如果不一样,则X不可变,如果一样,则X可变。
  • 便捷方法:用hash(X),只要不报错,证明X可被哈希,即不可变,反过来不可被哈希,即可变。

此外

  • 数值、字符、元组都能被哈希,因此它们是不可变类型。
  • 列表、集合、字典不能被哈希,因此它是可变类型。

5.1.2 字典的定义

字典是无序的键:值(key:value)对集合,键必须是互不相同的(在同一个字典之内)。

  • dict内部存放的顺序和key放入的顺序是没有关系的。
  • dict查找和插入的速度极快,不会随着key的增加而增加,但是需要占用大量的内存。

字典定义语法为 {元素1, 元素2, …, 元素n}

  • 其中每一个元素是一个「键值对」 – 键:值 (key:value)
  • 关键点是「大括号{}」,「逗号,」和「冒号:
  • 大括号 – 把所有元素绑在一起
  • 逗号 – 将每个键值对分开
  • 冒号 – 将键和值分开

字典的创建

  • dict()创建一个空的字典。
  • 通过key直接把数据放入字典中,但一个key只能对应一个value,多次对一个key放入value,新值会替换掉旧值。
  • dict(mapping)可以通过映射对象的(key,value)对来创建字典
dic1 = dict([('apple', 4139), ('peach', 4127), ('cherry', 4098)])
print(dic1)  # {'cherry': 4098, 'apple': 4139, 'peach': 4127}

dic2 = dict((('apple', 4139), ('peach', 4127), ('cherry', 4098)))
print(dic2)  # {'peach': 4127, 'cherry': 4098, 'apple': 4139}
  • dict(**kwargs)可以通过key=value对创建字典。但此时,key只能为字符串类型。
dic = dict(name='Tom', age=10)
print(dic)  # {'name': 'Tom', 'age': 10}
print(type(dic))  # <class 'dict'>

4.1.3 字典的内置方法

方法作用说明
dict.fromkeys(seq[, value])创建一个字典以序列seq中元素做字典的键,value为字典所有键对应的初始值
dict.keys()返回一个可迭代对象,包含dict中的所有key可以使用 list() 来转换为列表,列表为字典中的所有键
dict.values()返回一个可迭代对象,包含dict中的所有value可以使用 list() 来转换为列表,列表为字典中的所有值
dict.items()以列表返回可遍历的(key,value) 元组数组
dict.get(key, default=None)返回指定keyvalue,如果value不在字典中返回默认值
dict.setdefault(key, default=None)get()方法类似 如果key不存在于字典中,将会添加key并将value设为默认值
key in dictin操作符用于判断key是否存在于字典中,如果键在字典dict里返回True,否则返回Falsenot in操作符刚好相反,如果key在字典dict里返回False,否则返回True
dict.pop(key[,default])弹出字典给定键 key 所对应的值,返回值为被弹出的值key 值必须给出,若key不存在,则返回 default 值
del dict[key]删除字典给定键 key 所对应的值
dict.popitem()随机返回并删除字典中的一对键和值如果字典已经为空,却调用了此方法,就报出KeyError异常
dict.clear()用于删除字典内所有元素
dict.copy()返回一个字典的浅复制
dict.update(dict2)把字典参数dict2key:value键值对更新到字典dict

练习题:
1、字典基本操作

字典内容如下:

dic = {
    'python': 95,
    'java': 99,
    'c': 100
    }

用程序解答下面的题目

  • 字典的长度是多少
  • 请修改’java’ 这个key对应的value值为98
  • 删除 c 这个key
  • 增加一个key-value对,key值为 php, value是90
  • 获取所有的key值,存储在列表里
  • 获取所有的value值,存储在列表里
  • 判断 javascript 是否在字典中
  • 获得字典里所有value 的和
  • 获取字典里最大的value
  • 获取字典里最小的value
  • 字典 dic1 = {‘php’: 97}, 将dic1的数据更新到dic中
print(len(dic)) #3

dic['java']=98
print(dic) #{'python': 95, 'java': 98, 'c': 100}

dic['php']=90
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 90}

Keys = list(dic.keys())
print(Keys) #['python', 'java', 'c', 'php']

Values = list(dic.values())
print(Values) #[95, 98, 100, 90]

print('javascript' in dic) #False

print(sum(Values)) #383

print(max(Values)) #100

print(min(Values)) #90

dic1 = {'php':97}
dic.update(dic1)
print(dic) #{'python': 95, 'java': 98, 'c': 100, 'php': 97}

2、字典中的value

有一个字典,保存的是学生各个编程语言的成绩,内容如下

data = {
        'python': {'上学期': '90', '下学期': '95'},
        'c++': ['95', '96', '97'],
        'java': [{'月考':'90', '期中考试': '94', '期末考试': '98'}]
        }

各门课程的考试成绩存储方式并不相同,有的用字典,有的用列表,但是分数都是字符串类型,请实现函数transfer_score(score_dict),将分数修改成int类型。

5.2 集合

Python中setdict类似,也是一组key的集合,但不存储value。由于key不能重复,所以在set中,没有重复的key

5.2.1 集合的创建

  1. 创建空集合
  2. 向空集合加入元素
  • 创建空集合只能使用set()函数,此外set()可以直接将列表或元组转换为集合。
  • .add(obj)方法加入元素
  • 重复元素会被自动过滤
  • 直接把一堆元素用花括号括起来{元素1, 元素2, ..., 元素n}

由于set存储的是无序集合,所以我们不可以为集合创建索引或执行切片(slice)操作,也没有键(key)可用来获取集合中元素的值,但是可以判断一个元素是否在集合中。

  • tip:去掉列表中的重复元素,可以直接将列表转换为集合,再转换回列表。

5.2.2 集合的内置方法

方法作用说明
set.add(elmnt)向集合加入元素若集合中已存在该元素,则集合不改变
set.update(set1)向集合加入元素或集合若集合中已存在某一元素,则该元素会被自动过滤
set.discard(value)移除指定的集合元素set.remove()在移除一个不存在的元素时回发生错位,而set.discard()不会
set.pop()随机弹出一个元素
set1.intersection(set2)返回set1set2的交集
set1 & set2返回set1set2的交集
set1.intersection_update(set2)返回set1set2的交集移除set1中不重叠的元素
set1.union(set2)返回set1set2的并集
set1 | set2返回set1set2的并集
set1.difference(set2)返回set1set2的差集
set1 - set2返回set1set2的差集
set1.difference_update(set2)set1set2的差集直接在set1集合中移除元素,没有返回值
set1.symmetric_difference(set2)返回集合的异或
set1 ^ set2返回集合的异或
set1.symmetric_difference_update(set2)移除set1中在set2相同的元素,并将set2中不同的元素插入到set1
set1.issubset(set2)判断set1是否是set2的子集如果是则返回 True,否则返回False
set1 <= set2判断set1是否是set2的子集如果是则返回 True,否则返回False
set1.isdisjoint(set2)判断两个集合是否不相交如果是返回True,否则返回False

5.2.3 不可变集合

Python提供了不能改变元素的集合的实现版本,即不能增加或删除元素,类型名叫frozenset。需要注意的是frozenset仍然可以进行集合操作,只是不能用带有update()的方法。

  • frozenset([iterable])返回一个冻结的集合,冻结后集合不能再添加或删除任何元素。

练习题:

  1. 怎么表示只包含⼀个数字1的元组。
a = tuple([1])

print(a,type(a)) #(1,) <class 'tuple'>
  1. 创建一个空集合,增加 {‘x’,‘y’,‘z’} 三个元素。
a = set()
a.update({'x','y','z'})

print(a,type(a)) #{'y', 'x', 'z'} <class 'set'>
  1. 列表[‘A’, ‘B’, ‘A’, ‘B’]去重。
a = ['A', 'B', 'A', 'B']
a = list(set(a))

print(a,type(a)) #['B', 'A'] <class 'list'>
  1. 求两个集合{6, 7, 8},{7, 8, 9}中不重复的元素(差集指的是两个集合交集外的部分)。
a = {6,7,8}
b = {7,8,9}

a ^ b  # {6, 9}
a.symmetric_difference(b) #{6, 9}
  1. 求{‘A’, ‘B’, ‘C’}中元素在 {‘B’, ‘C’, ‘D’}中出现的次数。
a = {'A', 'B', 'C'}
b = {'B', 'C', 'D'}

c = list(a&b)
d = list(a - b)

for i in range(len(c)):
    print("集合 a 中的 %s 在%s中出现了1次"%(c[i],b))

for i in range(len(d)):
    print("集合 a 中的 %s 在%s中出现了0次"%(d[i],b))

#集合a中的 B 在{'D', 'B', 'C'}中出现了1次
#集合a中的 C 在{'D', 'B', 'C'}中出现了1次
#集合a中的 A 在{'D', 'B', 'C'}中出现了0次

5.3 序列

  • 在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作。
  • 但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。
方法作用说明
list(sub)把一个可迭代对象转换为列表
tuple(sub)把一个可迭代对象转换为元组
str(obj)把obj对象转换为字符串
len(obj)返回对象(字符、列表、元组等)长度或元素个数
max(sub)返回序列或者参数集合中的最大值
min(sub)返回序列或参数集合中的最小值
sum(iterable[, start=0])返回序列iterable与可选参数start的总和
sorted(iterable, key=None, reverse=False)对所有可迭代的对象进行排序操作
reversed(seq)函数返回一个反转的迭代器
enumerate(sequence, [start=0])用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标一般用在 for 循环当中
zip(iter1 [,iter2 [...]])用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用*操作符,可以将元组解压为列表

练习题:

  1. 怎么找出序列中的最大、小值?
    答:seq.max()seq.min()
  2. sort() 和 sorted() 区别
    答:sort()是方法,sorted()是函数,两者作用相同。
  3. 怎么快速求 1 到 100 所有整数相加之和?
    答:sum(range(100))
  4. 求列表 [2,3,4,5] 中每个元素的立方根。
import numpy as np
a = [2,3,4,5]
list(np.sqrt(a))
  1. 将[‘x’,‘y’,‘z’] 和 [1,2,3] 转成 [(‘x’,1),(‘y’,2),(‘z’,3)] 的形式。
a = ['x','y','z'] 
b = [1,2,3]
c = []
for i in range(len(a)):
    d = [a[i],b[i]]
    c.append(tuple(d))
print(c)
#[('x', 1), ('y', 2), ('z', 3)]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值