Python入门序列（列表，元组，字典，集合）

最新推荐文章于 2025-03-16 19:11:36 发布

待烟火清凉

最新推荐文章于 2025-03-16 19:11:36 发布

阅读量4.4w

点赞数 174

分类专栏： Python

本文链接：https://blog.csdn.net/gcxzflgl/article/details/83446331

版权

Python 专栏收录该内容

7 篇文章

订阅专栏

序列

序列是一种数据存储方式，用来存储一系列的数据。在内存中，序列就是一块用来存放多个值的连续的内存空间。比如一个整数序列[10,20,30,40]，可以这样示意表示：

由于 Python3 中一切皆对象，在内存中实际是按照如下方式存储的：
a = [10,20,30,40]

从图示中，我们可以看出序列中存储的是整数对象的地址，而不是整数对象的值。python
中常用的序列结构有：字符串、列表、元组、字典、集合

列表简介
列表：用于存储任意数目、任意类型的数据集合。
列表是内置可变序列，是包含多个元素的有序连续的内存空间。列表定义的标准语法格式：
a = [10,20,30,40]其中，10,20,30,40 这些称为：列表 a 的元素。
列表中的元素可以各不相同，可以是任意类型。比如：a = [10,20,'abc',True]

Python 的列表大小可变，根据需要随时增加或缩小。
字符串和列表都是序列类型，一个字符串是一个字符序列，一个列表是任何元素的序列

基本语法[]创建

list()创建 range()创建
使用 list()可以将任何可迭代的数据转化成列表。range()可以帮助我们非常方便的创建整数列表，语法格式为：
range([start,] end [,step])

append()方法

原地修改列表对象，是真正的列表尾部添加新的元素，速度最快，推荐使用。

+运算符操作
并不是真正的尾部添加元素，而是创建新的列表对象；将原列表的元素和新列表的元素依次
复制到新的列表对象中。这样，会涉及大量的复制操作，对于操作大量元素不建议使用。

通过如上测试，我们发现变量 a 的地址发生了变化。也就是创建了新的列表对象。

extend()方法
将目标列表的所有元素添加到本列表的尾部，属于原地操作，不创建新的列表对象。

insert()插入元素
使用 insert()方法可以将指定的元素插入到列表对象的任意制定位置。这样会让插入位置后面所有的元素进行移动，会影响处理速度。涉及大量元素时，尽量避免使用。类似发生这种移动的函数还有：remove()、pop()、del()，它们在删除非尾部元素时也会发生操作位置后面元素的移动。

del 删除
删除列表指定位置的元素。

pop()方法
pop()删除并返回指定位置元素，如果未指定位置则默认操作列表最后一个元素。

remove()方法
删除首次出现的指定元素，若不存在该元素抛出异常。

通过索引直接访问元素
可以通过索引直接访问元素。索引的区间在[0, 列表长度-1]这个范围。超过这个范围则会抛出异常。

index()获得指定元素在列表中首次出现的索引
index()可以获取指定元素首次出现的索引位置。语法是： index(value,[start,[end]])。其中，start 和 end 指定了搜索的范围。

count()获得指定元素在列表中出现的次数
count()可以返回指定元素在列表中出现的次数。

成员资格判断
判断列表中是否存在指定的元素，我们可以使用 count()方法，返回 0 则表示不存在，返回大于 0 则表示存在。但是，一般我们会使用更加简洁的 in 关键字来判断，直接返回 True或 False。

切片操作
在前面字符串章节，提到过字符串的切片操作，对于列表的切片操作和字符串类似。
切片是 Python 序列及其重要的操作，适用于列表、元组、字符串等等。切片的格式如下：
切片 slice 操作可以让我们快速提取子列表或修改。标准格式为：[起始偏移量 start:终止偏移量 end[:步长 step]]
注：当步长省略时顺便可以省略第二个冒号

切片操作时，起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围，也不会报错。起始偏移量小于 0 则会当做 0，终止偏移量大于“长度-1”会被当成”长度-1”

列表排序
修改原列表，不建新列表的排序

建新列表的排序
我们也可以通过内置函数 sorted()进行排序，这个方法返回新列表，不对原列表做修改。

reversed()返回迭代器
内置函数 reversed()也支持进行逆序排列，与列表对象 reverse()方法不同的是，内置函数
reversed()不对原列表做任何修改，只是返回一个逆序排列的迭代器对象。

打印输出 b 发现提示是：list_reverseiterator。也就是一个迭代对象。同时，我们使用list(b)进行输出，发现只能使用一次。第一次输出了元素，第二次为空。那是因为迭代对象在第一次时已经遍历结束了，第二次不能再使用。(类似游标指针)

列表相关的其他内置函数汇总

元组 tuple
列表属于可变序列，可以任意修改列表中的元素。元组属于不可变序列，不能修改元组中的
元素。因此，元组没有增加元素、修改元素、删除元素相关的方法。

元组的创建
通过()创建元组。小括号可以省略。
a = (10,20,30)或者a = 10,20,30
如果元组只有一个元素，则必须后面加逗号。这是因为解释器会把(1)解释为整数 1， (1,)解释为元组。

通过 tuple()创建元组 tuple(可迭代的对象)

总结：
tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组。
list()可以接收元组、字符串、其他序列类型、迭代器等生成列表。

元组的元素访问和计数
1. 元组的元素不能修改

列表关于排序的方法 list.sorted()是修改原列表对象，元组没有该方法。如果要对元组排
序，只能使用内置函数 sorted(tupleObj)

zip
zip(列表 1，列表 2，...)将多个列表对应位置的元素组合成为元组，并返回这个 zip 对象。

元组总结
1. 元组的核心特点是：不可变序列。
2. 元组的访问和处理速度比列表快。
3. 与整数和字符串一样，元组可以作为字典的键，列表则永远不能作为字典的键使用。

字典介绍
字典是“键值对”的无序可变序列，字典中的每个元素都是一个“键值对”，包含： “键对象”和“值对象”。可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。列表中我们通过“下标数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意的不可变数据，比如：整数、浮点数、字符串、元组。但是：列表、字典、集合这些可变对象，不能作为“键”。并且“键”不可重复。“值”可以是任意的数据，并且可重复。一个典型的字典的定义方式：a = {'name':'gaoqi','age':18,'job':'programmer'}
字典的创建
1. 我们可以通过{}、dict()来创建字典对象。

2. 通过 zip()创建字典对象

3. 通过 fromkeys 创建值为空的字典

字典元素的访问

1.通过[键]获得“值”。若键不存在，则抛出异常。

2. 通过 get()方法获得“值”。推荐使用。优点是：指定键不存在，返回 None；也可以设
定指定键不存在时默认返回的对象。推荐使用 get()获取“值对象”。

3.列出所有的键值对

字典元素添加、修改、删除

1. 给字典新增“键值对”。如果“键”已经存在，则覆盖旧的键值对；如果“键”不存在，则新增“键值对”

2. 使用 update()将新字典中所有键值对全部添加到旧字典对象上。如果 key 有重复，则直接覆盖。

3. 字典中元素的删除，可以使用 del()方法；或者 clear()删除所有键值对；pop()删除指定键值对，并返回对应的“值对象”

4.popitem() ：随机删除和返回该键值对。字典是“无序可变序列”，因此没有第一个元素、最后一个元素的概念；popitem 弹出随机的项，因为字典并没有"最后的元素"或者其他有关顺序的概念。若想一个接一个地移除并处理项，这个方法就非常有效（因为不用首先获取键的列表）。

序列解包
序列解包可以用于元组、列表、字典。序列解包可以让我们方便的对多个变量赋值.序列解包用于字典时，默认是对“键”进行操作；如果需要对键值对操作，则需要使用items()；如果需要对“值”进行操作，则需要使用 values()

字典核心底层原理(重要)
字典对象的核心是散列表。散列表是一个稀疏数组（总是有空白元素的数组），数组的每个单元叫做 bucket。每个 bucket 有两部分：一个是键对象的引用，一个是值对象的引用。由于所有 bucket 结构和大小一致，我们可以通过偏移量来读取指bucket。

将一个键值对放进字典的底层过程

假设字典 a 对象创建完后，数组长度为 7：

我要把”name”=”gaochenxi”这个键值对放到字典对象 a 中，第一步需要计算键”name”的散列值。Python 中通过 hash()来计算。

由于数组长度为 7，我们可以拿计算出的散列值的最右边 3 位数字作为偏移量，即“000”，十进制是数字 0。我们查看偏移量 0，对应的 bucket 是否为空。如果为空，则将键值对放进去。如果不为空，则依次取右边 3 位作为偏移量，即“010”，十进制是数字
2。再查看偏移量为 2 的 bucket 是否为空。直到找到为空的 bucket 将键值对放进去。流程图如下：

扩容
python 会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组，将原内容拷贝到新数组中。接近 2/3 时，数组就会扩容。

根据键查找“键值对”的底层过程

当我们调用 a.get(“name”)，就是根据键“name”查找到“键值对”，从而找到值对象“gaochenxi”。
第一步，我们仍然要计算“name”对象的散列值：

和存储的底层流程算法一致，也是依次取散列值的不同位置的数字。假设数组长度为7，我们可以拿计算出的散列值的最右边 3 位数字作为偏移量，即“00”，十进制是数字0。我们查看偏移量 0，对应的 bucket 是否为空。如果为空，则返回 None。如果不为空，则将这个 bucket 的键对象计算对应散列值，和我们的散列值进行比较，如果相等。则将对应“值对象”返回。如果不相等，则再依次取其他几位数字，重新计算偏移量。依次取完后，仍然没有找到。则返回 None。流程图如下：

用法总结：
1. 键必须可散列
(1) 数字、字符串、元组，都是可散列的。
(2) 自定义对象需要支持下面三点：
1支持 hash()函数
2支持通过__eq__()方法检测相等性。
3若 a==b 为真，则 hash(a)==hash(b)也为真。
2. 字典在内存中开销巨大，典型的空间换时间。
3. 键查询速度很快
4. 往字典里面添加新建可能导致扩容，导致散列表中键的次序变化。因此，不要在遍历字典的同时进行字典的修改。

集合
集合是无序可变元素不能重复。实际上集合底层是字典实现，集合的所有元素都是字典中的“键对象”，因此是不能重复的且唯一

集合创建和删除

1. 使用{}创建集合对象，并使用 add()方法添加元素

2. 使用 set()，将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据，则只保留一个。

3. remove()删除指定元素；clear()清空整个集合

集合相关操作，像数学中概念一样，Python 对集合也提供了并集、交集、差集等运算。给出示例：

推导式创建序列
推导式是从一个或者多个迭代器快速创建序列的一种方法。它可以将循环和条件判断结合，从而避免冗长的代码。推导式是典型的 Python 风格

列表推导式
列表推导式生成列表对象，语法如下：
[表达式foritemin 可迭代对象 ]或者：{表达式foritemin 可迭代对象if条件判断}
>>> [x for x in range(1,5)]
[1, 2, 3, 4]
>>> [x*2 for x in range(1,5)]
[2, 4, 6, 8]
>>> [x*2 for x in range(1,20) if x%5==0 ]
[10, 20, 30]
>>> [aforain "abcdefg"]
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> cells = [(row,col) forrow in range(1,10) for col in range(1,10)]#可以使用两个循环
>>> for cell in cells:
print(cell)

字典推导式
字典的推导式生成字典对象，格式如下：
{key_expression:value_expressionfor表达式in可迭代对象}类似于列表推导式，字典推导也可以增加 if 条件判断、多个 for 循环。
统计文本中字符出现的次数：
>>> my_text = ' i love you, i love china, i love gao'
>>> char_count = {c:my_text.count(c)for c in my_text}
>>> char_count
{' ': 9, 'i': 4, 'l': 3, 'o': 5, 'v': 3, 'e': 3, 'y': 1, 'u': 1, ',': 2, 'h': 1, 'n': 1, 'c': 1, 'g': 1, 'a': 2}

集合推导式
集合推导式生成集合，和列表推导式的语法格式类似：
{表达式foritemin 可迭代对象 }或者：{表达式foritemin 可迭代对象if条件判断}
>>> {x for x in range(1,100) if x%9==0}
{99, 36, 72, 9, 45, 81, 18, 54, 90, 27, 63}

生成器推导式（生成元组）
>>> (x for x in range(1,100) if x%9==0)
<generator object <genexpr> at 0x0000000002BD3048>
我们发现提示的是“一个生成器对象”。显然，元组是没有推导式的。一个生成器只能运行一次。第一次迭代可以得到数据，第二次迭代发现数据已经没有了。
>>> gnt = (x for x in range(1,100) if x%9==0)
>>> for x in gnt:
print(x,end=' ')
9 18 27 36 45 54 63 72 81 90 99
>>> for x in gnt:
print(x,end=' ')
>>>