2021-03-02-Python学习笔记之4-元组、字典、集合

一、元组
列表属于可变序列,可以任意修改列表中的元素;元组属于不可变序列,不能修改元组中的元素,因此元组没有增加元素、修改元素、删除元素相关的方法。只需要学习元组的创建和删除、元素的访问和计数即可。元组支持如下操作:
1)索引访问
2)切片操作
3)连接操作
4)成员关系操作
5)比较运算操作
6)计数:元组长度 len() 、最大值 max()、 最小值 min() 、求和 sum() 等。
1.元组的创建

  • 通过小括号 () 创建,() 可以省略
    a = (10,20,30) 或者 a = 10,20,30
    如果元组只有一个元素,则必须后面添加逗号,这是因为解释器会把 (1) 解释为整数 1,(1,)解释为元组。
>>> a = (1)
>>> type(a)
<class 'int'>
>>> a = (1,)
>>> 
>>> type(a)
<class 'tuple'>
>>> a = (10,20,30)
>>> a
(10, 20, 30)
>>> type(a)
<class 'tuple'>
>>> a = 10,20,30
>>> a
(10, 20, 30)
>>> type(a)
<class 'tuple'>
>>> 
  • 通过 tuple() 创建元组
    tuple(可迭代的对象)
>>> b = tuple()   #创建一个空元组对象
>>> b = tuple('abc')
>>> b
('a', 'b', 'c')
>>> b = tuple(range(3))
>>> b
(0, 1, 2)
>>> b = tuple([2,3,4])
>>> b
(2, 3, 4)
>>> 

总结:
tuple() 可以接收列表、字符串、其他序列类型、迭代器等生成元组。
list() 可以接收元组、字符串、其他序列类型、迭代器等生成列表。
2.元组对象的删除
语法:

del 元组名字

示例:

>>> b
(2, 3, 4)
>>> del b
>>> b
Traceback (most recent call last):
  File "<pyshell#202>", line 1, in <module>
    b
NameError: name 'b' is not defined
>>> 

3.元组的元素访问和计数

  • 元组元素不能修改
>>> a = 10,20,30
>>> a
(10, 20, 30)
>>> a[0]
10
>>> a(0)
Traceback (most recent call last):
  File "<pyshell#206>", line 1, in <module>
    a(0)
TypeError: 'tuple' object is not callable
>>> a[0] = 100    #元组不支持元素修改
Traceback (most recent call last):
  File "<pyshell#207>", line 1, in <module>
    a[0] = 100
TypeError: 'tuple' object does not support item assignment
>>> 
  • 元组元素访问
>>> a = (20,10,30,9,8)
>>> a
(20, 10, 30, 9, 8)
>>> a[1]
10
>>> a[1:4:2]
(10, 9)
>>> a[1:3]
(10, 30)
>>> a[:4]
(20, 10, 30, 9)
>>> 
  • 元组排序
    列表排序是修改了原列表对象,元组没有该方法,如果要对元组排序,只能使用内置函数 sorted(tupleObj),并生成新的列表对象。
>>> a
(20, 10, 30, 9, 8)
>>> sorted(a)
[8, 9, 10, 20, 30]
>>> a
(20, 10, 30, 9, 8)
>>> sorted(a,reverse=True)
[30, 20, 10, 9, 8]
>>> a
(20, 10, 30, 9, 8)
>>> b = 2,30
>>> a + b
(20, 10, 30, 9, 8, 2, 30)
>>> a
(20, 10, 30, 9, 8)
>>> b
(2, 30)
>>> max(a)
30
>>> min(a)
8
>>> sum(a)
77
>>> len(a)
5
>>>  
  • zip
    zip(列表eh1,列表2,…)将多个列表对应位置的元素合成为元组,并返回这个 zip 对象。
>>> a = [10,20,30]
>>> b = [40,50,60]
>>> c = [70,80,90]
>>> d = zip(a,b,c)
>>> d
<zip object at 0x000001D6C5F4F740>
>>> list(d)
[(10, 40, 70), (20, 50, 80), (30, 60, 90)]
>>> 

4.生成器推导式创建元组
从形式上看,生成器推导式与列表推导式类似,只是生成器推导式使用小括号,列表推导式直接生成列表对象,生成器推导式生成的不是列表也不是元组,而是一个生成器对象。
我们可以通过生成器对象,转化成列表或者元组。也可以使用生成器对象的__next__()方法进行遍历,或者直接作为迭代器对象来使用。不管什么方式使用,元素访问结束后,如果需要重新访问其中的元素,必须重新创建该生成器对象。
生成器对象只能用一次,因为用完一次后,指针指向的值已经为空了。

>>> s = (x*2 for x in range(5))
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>> tuple(s)
(0, 2, 4, 6, 8)
>>> tuple(s)
()
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>> tuple(s)
()
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>> 

也可以通过 s.__next__()依次移动指针

>>> s = (x*2 for x in range(5))
>>> s.__next__()
0
>>> s.__next__()
2
>>> s.__next__()
4
>>> s.__next__()
6
>>> s.__next__()
8
>>> s.__next__()
Traceback (most recent call last):
  File "<pyshell#264>", line 1, in <module>
    s.__next__()
StopIteration
>>> 

总结:
* 元组核心特点:不可变序列
* 元组的访问和处理速度比列表快
* 与整数和字符串一样,元组可以作为字典的键,列表则永远不能作为字典的键使用。
二、字典
字典是“键值对”的无序可变序列,字典中的每个元素都是“键值对”,包含:“键对象” 和“值对象”,可以通过 “键对象” 实现快速获取、删除、更新对应的 “值对象”。
列表中我们通过 “下标数字” 找到对应的对象。字典中通过 “键对象” 找到对应的 “值对象” 。“键” 是任意不可变数据,比如:整数、浮点数、字符串、元组。但是:列表、字典、集合这些可变对象,不能作为 “键” ,并且 “键” 不可重复。
“值” 可以是任意的数据,并且可重复。
一个字典的定义方式:

a = {'name':'张三', 'age':18, 'job':'程序员'}

1.字典的创建

  • 可以通过{}、dict{} 来创建字典对象。
>>> a = {'name':'张三','age':18,'job':'程序员'}
>>> a
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> b = dict(name='张三',age=18,job='程序员')
>>> b
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> a = dict([('name','张三'),('age',18)])
>>> a
{'name': '张三', 'age': 18}
>>> c = {}
>>> c
{}
>>> d = dict()
>>> d
{}
>>> f = [('name','张三'),('age',18)]
>>> f
[('name', '张三'), ('age', 18)]
>>> 
  • 通过 zip() 创建字典对象
>>> k = ['name','age','job']
>>> v = ['张三',18,'程序员']
>>> s = dict(zip(k,v))
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> 
  • 通过 fromkeys 创建值为空的字典
>>> a = dict.fromkeys(['name','age','job'])
>>> a
{'name': None, 'age': None, 'job': None}
>>> 

2.字典元素的访问

  • 通过 [键] 获得 “值”,若键不存在,则抛出异常。
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s['age']
18
>>> s['name']
'张三'
>>> s['hk']
Traceback (most recent call last):
  File "<pyshell#309>", line 1, in <module>
    s['hk']
KeyError: 'hk'
>>> 
  • 通过 get() 方法获得 “值”,推荐使用。优点:指定键不存在,返回None;也可以设指定键不存在时默认返回的对象。推荐使用 get() 获取 “值对象”。
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.get('age')
18
>>> s.get('hk')
>>> print(s.get('hk'))
None
>>> a.get('aaa','不存在')   #设指定键不存在时默认返回的对象为‘不存在’
'不存在'
>>> 
  • 列出所有的键值对
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.items()
dict_items([('name', '张三'), ('age', 18), ('job', '程序员')])
  • 列出所有的键,列出所有的值
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.keys()
dict_keys(['name', 'age', 'job'])
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.values()
dict_values(['张三', 18, '程序员'])
>>> 
  • len() 键值对的个数
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> len(s)
3
>>> 
  • 检测一个“键”是否在字典中
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> 'name' in s
True
>>> '张三' in s
False
>>> 

3.字典元素添加、修改、删除

  • 给字典新增 “键值对” 时,如果 “键” 已经存在,则覆盖旧的 “键值对”;如果 “键” 不存在,则新增 “键值对”。
>>> s['address'] = '南京市栖霞区'
>>> s
{'name': '张三', 'age': 18, 'job': '程序员', 'address': '南京市栖霞区'}
>>> s['age'] = 20
>>> s
{'name': '张三', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区'}
>>> 
  • 使用 update() 将新字典中所有键值对全部添加到旧字典对象上。如果 key 有重复,则直接覆盖。
>>> s
{'name': '张三', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区'}
>>> m = {'name':'李四','money':1000,'sex':'男'}
>>> m
{'name': '李四', 'money': 1000, 'sex': '男'}
>>> s.update(m)
>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000, 'sex': '男'}
>>> 
  • 字典中元素的删除,可以用 del() 方法,或者 clear()删除所有键值对;pop()删除指定键值对,并返回对应的 “值对象” 。
>>> m
{'name': '李四', 'money': 1000, 'sex': '男'}
>>> del(m['name'])
>>> m
{'money': 1000, 'sex': '男'}
>>> m.pop('money')
1000
>>> m
{'sex': '男'}
>>> 
  • popitem():随机删除和返回该键值对。字典是 “无序可变序列”,因此没有第一个元素、最后一个元素的概念;popitem 弹出随机项,因为字典并没有“最后的额元素”或者其他有关顺序的概念。若想一个接一个地移除并处理项,这个方法非常有效(因为不用首先获取键的列表)
>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000, 'sex': '男'}
>>> s.popitem()
('sex', '男')
>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000}
>>> 
  • 4.序列解包
    可以用于元组、列表、字典,也可以让我们方便的对多个变量赋值。用于元组列表时:
>>> x,y,z = (20,30,10)
>>> x
20
>>> y
30
y
>>> z
10
>>> (a,b,c) = (9,8,10)
>>> a
9
>>> b
8
>>> c
10
>>> [a,b,c] = [10,20,30]
>>> a
10
>>> b
20
>>> c
30
>>> 

序列解包用于字典时,默认是对 “键” 进行操作;如果需要对键值对操作,则需要使用 items() ;如果需要对 “值” 进行操作,则需要使用 values() :

>>> a = {'name':'张三','age':18,'job':'程序员'}
>>> a
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> x,y,z = a		#默认对键进行操作
>>> x
'name'
x
>>> y
'age'
>>> z
'job'
>>> x,y,z = a.items()		#对键值进行操作
>>> x
('name', '张三')
>>> y
('age', 18)
>>> z
('job', '程序员')
>>> x,y,z = a.values()			#对值进行操作
>>> x
'张三'
>>> y
18
>>> z
'程序员'
>>> 

5.复杂表格数据存储
表格数据使用字典和列表存储,并实现访问
在这里插入图片描述
代码:

r1 = {'name':'高小一','age':18,'salary':30000,'city':'北京'}
r2 = {'name':'高小二','age':19,'salary':20000,'city':'上海'}
r3 = {'name':'高小五','age':20,'salary':10000,'city':'深圳'}
tb = [r1,r2,r3]
print('name',end = '\t')
print('age',end = '\t')
print('salary',end = '\t')
print('city')
for i in range(3):
    print(tb[i].get('name'),end = '\t')
    print(tb[i].get('age'),end = '\t')
    print(tb[i].get('salary'),end = '\t')
    print(tb[i].get('city'))

运行结果:
在这里插入图片描述
6.字典核心底层原理
字典对象的核心是散列表,散列表是一个稀疏数组(总是有空白元素的数组),数组的每个单元叫bucket,每个bucket有两个部分:一个是键对象的引用,一个是值对象的引用。由于所有bucket结构和大小一致,我们可以通过偏移量来读取指定bucket。
参考链接:字典核心底层原理在这里插入图片描述

  • 将一个键值对放进字典的底层过程
>>> a = {}
>>> a['name'] = 'jack'
>>> a
{'name': 'jack'}

假设字典 a对象创建完后,数组长度为 8:
在这里插入图片描述
我们要把”name”=”jack”这个键值对放到字典对象 a 中,首先第一步需要计算 键”name”的散列值。Python 中可以通过hash()来计算。

>>> bin(hash("name"))
'-0b1010111101001110110101100100101'

由于数组长度为 8,我们可以拿计算出的散列值的最右边 3 位数字作为偏移量,即 “101”,十进制是数字 5。我们查看偏移量 5,对应的 bucket 是否为空。如果为空,则 将键值对放进去。如果不为空,则依次取右边 3位作为偏移量,即“100”,十进制是数字4。再查看偏移量为 4 的 bucket 是否为空。直到找到为空的 bucket 将键值对放进去。流 程图如下:
在这里插入图片描述
(python会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组,将原有内容 拷贝到新数组中。容量接近 2/3 时,数组就会扩容。)

>>> a.get("name")
'gaoqi'

当我们调用a.get(“name”),就是根据键“name”查找到“键值对”,从而找到值对象“gaoqi”。
第一步,我们仍然要计算“name”对象的散列值:

>>> bin(hash("name"))         '-0b1010111101001110110101100100101'

和存储的底层流程算法一致,也是依次取散列值的不同位置的数字。 假设数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即“101”,十进制是数字5。我们查看偏移量5,对应的bucket是否为空。如果为空,则返回None。如果不为空,则将这个bucket的键对象计算对应散列值,和我们的散列值进行比较,如果相等。则将对应“值对象”返回。如果不相等,则再依次取其他几位数字,重新计算偏移量。依次取完后,仍然没有找到。则返回None。流程图如下:
在这里插入图片描述
用法总结:
  1. 键必须可散列
  (1) 数字、字符串、元组,都是可散列的。
  (2) 自定义对象需要支持下面三点:
  ① 支持hash()函数
  ② 支持通过__eq__()方法检测相等性。
  ③ 若a==b为真,则hash(a)==hash(b)也为真。
  2. 字典在内存中开销巨大,典型的空间换时间。
  3. 键查询速度很快
  4. 往字典里面添加新建可能导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改。要先进行遍历,再进行修改。

三、集合
集合是无序可变的,元素不能重复。实际上,集合底层是字典实现,集合的所有元素都是字典中的 “键对象” ,因此是不能重复的且是唯一的。
1.集合创建和删除

  • 使用 {} 创建集合对象,并使用 add() 方法添加元素
>>> a = {3,5,7}
>>> a.add(9)
>>> a
{9, 3, 5, 7}
>>> 
  • 使用 set() ,将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据,则只保留一个。
>>> b = ['a','b','c','b']
>>> c = set(a)
>>> c
{3, 20, 5, 7, 9}
>>> 
  • remove() 删除指定元素;clear() 清空整个集合
>>> a.remove(20)
>>> a
{3, 5, 7, 9}
>>> a.clear()
>>> a
set()
  • 集合相关操作
    python中有交集、并集、差集等运算。
>>> a = {1,3,'sxt'}
>>> b ={'he','it','sxt'}
>>> a|b								#并集
{1, 3, 'sxt', 'it', 'he'}
>>> a&b								#交集
{'sxt'}
>>> a - b							#差集
{1, 3}
>>> a.union(b)						#并集
{1, 3, 'sxt', 'it', 'he'}
>>> a.intersection(b)				#交集
{'sxt'}
>>> a.difference(b)					#差集
{1, 3}
>>> 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

努力学习的代码小白

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值