2021-03-02-Python学习笔记之4-元组、字典、集合

最新推荐文章于 2024-05-24 10:52:46 发布

努力学习的代码小白

最新推荐文章于 2024-05-24 10:52:46 发布

阅读量153

点赞数

分类专栏：学习笔记文章标签： python

本文链接：https://blog.csdn.net/weixin_42656213/article/details/114286306

版权

学习笔记专栏收录该内容

63 篇文章 9 订阅

订阅专栏

一、元组
列表属于可变序列，可以任意修改列表中的元素；元组属于不可变序列，不能修改元组中的元素，因此元组没有增加元素、修改元素、删除元素相关的方法。只需要学习元组的创建和删除、元素的访问和计数即可。元组支持如下操作：
1）索引访问
2）切片操作
3）连接操作
4）成员关系操作
5）比较运算操作
6）计数：元组长度 len() 、最大值 max()、最小值 min() 、求和 sum() 等。
1.元组的创建

通过小括号 () 创建，() 可以省略
a = (10,20,30) 或者 a = 10,20,30
如果元组只有一个元素，则必须后面添加逗号，这是因为解释器会把 (1) 解释为整数 1，(1,)解释为元组。

>>> a = (1)
>>> type(a)
<class 'int'>
>>> a = (1,)
>>> 
>>> type(a)
<class 'tuple'>
>>> a = (10,20,30)
>>> a
(10, 20, 30)
>>> type(a)
<class 'tuple'>
>>> a = 10,20,30
>>> a
(10, 20, 30)
>>> type(a)
<class 'tuple'>
>>>

通过 tuple() 创建元组
tuple(可迭代的对象)

>>> b = tuple()   #创建一个空元组对象
>>> b = tuple('abc')
>>> b
('a', 'b', 'c')
>>> b = tuple(range(3))
>>> b
(0, 1, 2)
>>> b = tuple([2,3,4])
>>> b
(2, 3, 4)
>>>

总结：
tuple() 可以接收列表、字符串、其他序列类型、迭代器等生成元组。
list() 可以接收元组、字符串、其他序列类型、迭代器等生成列表。
2.元组对象的删除
语法：

del 元组名字

示例：

>>> b
(2, 3, 4)
>>> del b
>>> b
Traceback (most recent call last):
  File "<pyshell#202>", line 1, in <module>
    b
NameError: name 'b' is not defined
>>>

3.元组的元素访问和计数

元组元素不能修改

>>> a = 10,20,30
>>> a
(10, 20, 30)
>>> a[0]
10
>>> a(0)
Traceback (most recent call last):
  File "<pyshell#206>", line 1, in <module>
    a(0)
TypeError: 'tuple' object is not callable
>>> a[0] = 100    #元组不支持元素修改
Traceback (most recent call last):
  File "<pyshell#207>", line 1, in <module>
    a[0] = 100
TypeError: 'tuple' object does not support item assignment
>>>

元组元素访问

>>> a = (20,10,30,9,8)
>>> a
(20, 10, 30, 9, 8)
>>> a[1]
10
>>> a[1:4:2]
(10, 9)
>>> a[1:3]
(10, 30)
>>> a[:4]
(20, 10, 30, 9)
>>>

元组排序
列表排序是修改了原列表对象，元组没有该方法，如果要对元组排序，只能使用内置函数 sorted(tupleObj)，并生成新的列表对象。

>>> a
(20, 10, 30, 9, 8)
>>> sorted(a)
[8, 9, 10, 20, 30]
>>> a
(20, 10, 30, 9, 8)
>>> sorted(a,reverse=True)
[30, 20, 10, 9, 8]
>>> a
(20, 10, 30, 9, 8)
>>> b = 2,30
>>> a + b
(20, 10, 30, 9, 8, 2, 30)
>>> a
(20, 10, 30, 9, 8)
>>> b
(2, 30)
>>> max(a)
30
>>> min(a)
8
>>> sum(a)
77
>>> len(a)
5
>>>

zip
zip(列表eh1，列表2，…)将多个列表对应位置的元素合成为元组，并返回这个 zip 对象。

>>> a = [10,20,30]
>>> b = [40,50,60]
>>> c = [70,80,90]
>>> d = zip(a,b,c)
>>> d
<zip object at 0x000001D6C5F4F740>
>>> list(d)
[(10, 40, 70), (20, 50, 80), (30, 60, 90)]
>>>

4.生成器推导式创建元组
从形式上看，生成器推导式与列表推导式类似，只是生成器推导式使用小括号，列表推导式直接生成列表对象，生成器推导式生成的不是列表也不是元组，而是一个生成器对象。
我们可以通过生成器对象，转化成列表或者元组。也可以使用生成器对象的__next__()方法进行遍历，或者直接作为迭代器对象来使用。不管什么方式使用，元素访问结束后，如果需要重新访问其中的元素，必须重新创建该生成器对象。
生成器对象只能用一次，因为用完一次后，指针指向的值已经为空了。

>>> s = (x*2 for x in range(5))
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>> tuple(s)
(0, 2, 4, 6, 8)
>>> tuple(s)
()
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>> tuple(s)
()
>>> s
<generator object <genexpr> at 0x000001D6C5F1A0B0>
>>>

也可以通过 s.__next__()依次移动指针

>>> s = (x*2 for x in range(5))
>>> s.__next__()
0
>>> s.__next__()
2
>>> s.__next__()
4
>>> s.__next__()
6
>>> s.__next__()
8
>>> s.__next__()
Traceback (most recent call last):
  File "<pyshell#264>", line 1, in <module>
    s.__next__()
StopIteration
>>>

总结：
* 元组核心特点：不可变序列
* 元组的访问和处理速度比列表快
* 与整数和字符串一样，元组可以作为字典的键，列表则永远不能作为字典的键使用。
二、字典
字典是“键值对”的无序可变序列，字典中的每个元素都是“键值对”，包含：“键对象” 和“值对象”，可以通过 “键对象” 实现快速获取、删除、更新对应的 “值对象”。
列表中我们通过 “下标数字” 找到对应的对象。字典中通过 “键对象” 找到对应的 “值对象” 。“键” 是任意不可变数据，比如：整数、浮点数、字符串、元组。但是：列表、字典、集合这些可变对象，不能作为 “键” ，并且 “键” 不可重复。
“值” 可以是任意的数据，并且可重复。
一个字典的定义方式：

a = {'name':'张三', 'age':18, 'job':'程序员'}

1.字典的创建

可以通过{}、dict{} 来创建字典对象。

>>> a = {'name':'张三','age':18,'job':'程序员'}
>>> a
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> b = dict(name='张三',age=18,job='程序员')
>>> b
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> a = dict([('name','张三'),('age',18)])
>>> a
{'name': '张三', 'age': 18}
>>> c = {}
>>> c
{}
>>> d = dict()
>>> d
{}
>>> f = [('name','张三'),('age',18)]
>>> f
[('name', '张三'), ('age', 18)]
>>>

通过 zip() 创建字典对象

>>> k = ['name','age','job']
>>> v = ['张三',18,'程序员']
>>> s = dict(zip(k,v))
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>>

通过 fromkeys 创建值为空的字典

>>> a = dict.fromkeys(['name','age','job'])
>>> a
{'name': None, 'age': None, 'job': None}
>>>

2.字典元素的访问

通过 [键] 获得 “值”，若键不存在，则抛出异常。

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s['age']
18
>>> s['name']
'张三'
>>> s['hk']
Traceback (most recent call last):
  File "<pyshell#309>", line 1, in <module>
    s['hk']
KeyError: 'hk'
>>>

通过 get() 方法获得 “值”，推荐使用。优点：指定键不存在，返回None；也可以设指定键不存在时默认返回的对象。推荐使用 get() 获取 “值对象”。

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.get('age')
18
>>> s.get('hk')
>>> print(s.get('hk'))
None
>>> a.get('aaa','不存在')   #设指定键不存在时默认返回的对象为‘不存在’
'不存在'
>>>

列出所有的键值对

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.items()
dict_items([('name', '张三'), ('age', 18), ('job', '程序员')])

列出所有的键，列出所有的值

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.keys()
dict_keys(['name', 'age', 'job'])
>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> s.values()
dict_values(['张三', 18, '程序员'])
>>>

len() 键值对的个数

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> len(s)
3
>>>

检测一个“键”是否在字典中

>>> s
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> 'name' in s
True
>>> '张三' in s
False
>>>

3.字典元素添加、修改、删除

给字典新增 “键值对” 时，如果 “键” 已经存在，则覆盖旧的 “键值对”；如果 “键” 不存在，则新增 “键值对”。

>>> s['address'] = '南京市栖霞区'
>>> s
{'name': '张三', 'age': 18, 'job': '程序员', 'address': '南京市栖霞区'}
>>> s['age'] = 20
>>> s
{'name': '张三', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区'}
>>>

使用 update() 将新字典中所有键值对全部添加到旧字典对象上。如果 key 有重复，则直接覆盖。

>>> s
{'name': '张三', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区'}
>>> m = {'name':'李四','money':1000,'sex':'男'}
>>> m
{'name': '李四', 'money': 1000, 'sex': '男'}
>>> s.update(m)
>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000, 'sex': '男'}
>>>

字典中元素的删除，可以用 del() 方法，或者 clear()删除所有键值对；pop()删除指定键值对，并返回对应的 “值对象” 。

>>> m
{'name': '李四', 'money': 1000, 'sex': '男'}
>>> del(m['name'])
>>> m
{'money': 1000, 'sex': '男'}
>>> m.pop('money')
1000
>>> m
{'sex': '男'}
>>>

popitem()：随机删除和返回该键值对。字典是 “无序可变序列”，因此没有第一个元素、最后一个元素的概念；popitem 弹出随机项，因为字典并没有“最后的额元素”或者其他有关顺序的概念。若想一个接一个地移除并处理项，这个方法非常有效（因为不用首先获取键的列表）

>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000, 'sex': '男'}
>>> s.popitem()
('sex', '男')
>>> s
{'name': '李四', 'age': 20, 'job': '程序员', 'address': '南京市栖霞区', 'money': 1000}
>>>

4.序列解包
可以用于元组、列表、字典，也可以让我们方便的对多个变量赋值。用于元组列表时：

>>> x,y,z = (20,30,10)
>>> x
20
>>> y
30
y
>>> z
10
>>> (a,b,c) = (9,8,10)
>>> a
9
>>> b
8
>>> c
10
>>> [a,b,c] = [10,20,30]
>>> a
10
>>> b
20
>>> c
30
>>>

序列解包用于字典时，默认是对 “键” 进行操作；如果需要对键值对操作，则需要使用 items() ；如果需要对 “值” 进行操作，则需要使用 values() ：

>>> a = {'name':'张三','age':18,'job':'程序员'}
>>> a
{'name': '张三', 'age': 18, 'job': '程序员'}
>>> x,y,z = a		#默认对键进行操作
>>> x
'name'
x
>>> y
'age'
>>> z
'job'
>>> x,y,z = a.items()		#对键值进行操作
>>> x
('name', '张三')
>>> y
('age', 18)
>>> z
('job', '程序员')
>>> x,y,z = a.values()			#对值进行操作
>>> x
'张三'
>>> y
18
>>> z
'程序员'
>>>

5.复杂表格数据存储
表格数据使用字典和列表存储，并实现访问
在这里插入图片描述
代码：

r1 = {'name':'高小一','age':18,'salary':30000,'city':'北京'}
r2 = {'name':'高小二','age':19,'salary':20000,'city':'上海'}
r3 = {'name':'高小五','age':20,'salary':10000,'city':'深圳'}
tb = [r1,r2,r3]
print('name',end = '\t')
print('age',end = '\t')
print('salary',end = '\t')
print('city')
for i in range(3):
    print(tb[i].get('name'),end = '\t')
    print(tb[i].get('age'),end = '\t')
    print(tb[i].get('salary'),end = '\t')
    print(tb[i].get('city'))

运行结果：
在这里插入图片描述
6.字典核心底层原理
字典对象的核心是散列表，散列表是一个稀疏数组（总是有空白元素的数组），数组的每个单元叫bucket，每个bucket有两个部分：一个是键对象的引用，一个是值对象的引用。由于所有bucket结构和大小一致，我们可以通过偏移量来读取指定bucket。
参考链接：字典核心底层原理在这里插入图片描述

将一个键值对放进字典的底层过程

>>> a = {}
>>> a['name'] = 'jack'
>>> a
{'name': 'jack'}

假设字典 a对象创建完后，数组长度为 8：
在这里插入图片描述
我们要把”name”=”jack”这个键值对放到字典对象 a 中，首先第一步需要计算键”name”的散列值。Python 中可以通过hash()来计算。

>>> bin(hash("name"))
'-0b1010111101001110110101100100101'

由于数组长度为 8，我们可以拿计算出的散列值的最右边 3 位数字作为偏移量，即 “101”，十进制是数字 5。我们查看偏移量 5，对应的 bucket 是否为空。如果为空，则将键值对放进去。如果不为空，则依次取右边 3位作为偏移量，即“100”，十进制是数字4。再查看偏移量为 4 的 bucket 是否为空。直到找到为空的 bucket 将键值对放进去。流程图如下：
在这里插入图片描述
（python会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组，将原有内容拷贝到新数组中。容量接近 2/3 时，数组就会扩容。）

根据键查找 “键值对” 的底层过程
参考链接：根据键查找“键值对”的底层过程
知道了一个键值是如何存储到数组中的，根据键对象取到对象，理解起来就比较简单。

>>> a.get("name")
'gaoqi'

当我们调用a.get(“name”)，就是根据键“name”查找到“键值对”，从而找到值对象“gaoqi”。
第一步，我们仍然要计算“name”对象的散列值：

>>> bin(hash("name"))         '-0b1010111101001110110101100100101'

和存储的底层流程算法一致，也是依次取散列值的不同位置的数字。假设数组长度为8，我们可以拿计算出的散列值的最右边3位数字作为偏移量，即“101”，十进制是数字5。我们查看偏移量5，对应的bucket是否为空。如果为空，则返回None。如果不为空，则将这个bucket的键对象计算对应散列值，和我们的散列值进行比较，如果相等。则将对应“值对象”返回。如果不相等，则再依次取其他几位数字，重新计算偏移量。依次取完后，仍然没有找到。则返回None。流程图如下：
在这里插入图片描述
用法总结：
　　1. 键必须可散列
　　(1) 数字、字符串、元组，都是可散列的。
　　(2) 自定义对象需要支持下面三点：
　　① 支持hash()函数
　　② 支持通过__eq__()方法检测相等性。
　　③ 若a==b为真，则hash(a)==hash(b)也为真。
　　2. 字典在内存中开销巨大，典型的空间换时间。
　　3. 键查询速度很快
　　4. 往字典里面添加新建可能导致扩容，导致散列表中键的次序变化。因此，不要在遍历字典的同时进行字典的修改。要先进行遍历，再进行修改。

三、集合
集合是无序可变的，元素不能重复。实际上，集合底层是字典实现，集合的所有元素都是字典中的 “键对象” ，因此是不能重复的且是唯一的。
1.集合创建和删除

使用 {} 创建集合对象，并使用 add() 方法添加元素

>>> a = {3,5,7}
>>> a.add(9)
>>> a
{9, 3, 5, 7}
>>>

使用 set() ，将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据，则只保留一个。

>>> b = ['a','b','c','b']
>>> c = set(a)
>>> c
{3, 20, 5, 7, 9}
>>>

remove() 删除指定元素；clear() 清空整个集合

>>> a.remove(20)
>>> a
{3, 5, 7, 9}
>>> a.clear()
>>> a
set()

集合相关操作
python中有交集、并集、差集等运算。

>>> a = {1,3,'sxt'}
>>> b ={'he','it','sxt'}
>>> a|b								#并集
{1, 3, 'sxt', 'it', 'he'}
>>> a&b								#交集
{'sxt'}
>>> a - b							#差集
{1, 3}
>>> a.union(b)						#并集
{1, 3, 'sxt', 'it', 'he'}
>>> a.intersection(b)				#交集
{'sxt'}
>>> a.difference(b)					#差集
{1, 3}
>>>

努力学习的代码小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2021-03-02-Python学习笔记之4-元组、字典、集合

一、元组列表属于可变序列，可以任意修改列表中的元素；元组属于不可变序列，不能修改元组中的元素，因此元组没有增加元素、修改元素、删除元素相关的方法。只需要学习元组的创建和删除、元素的访问和计数即可。元组支持如下操作：1）索引访问2）切片操作3）连接操作4）成员关系操作5）比较运算操作6）计数：元组长度 len() 、最大值 max()、最小值 min() 、求和 sum() 等。1.元组的创建通过小括号 () 创建，() 可以省略a = (10,20,30) 或者 a = 10,2
复制链接

扫一扫