Python中的序列结构（列表、元组、字典、集合的定义和内置函数）

最新推荐文章于 2024-05-01 01:59:19 发布

faithfulzl

最新推荐文章于 2024-05-01 01:59:19 发布

阅读量1.4k

点赞数 5

分类专栏： Python 文章标签： python 序列结构列表元组字典

本文链接：https://blog.csdn.net/faithfulzl/article/details/103224160

版权

Python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

Python序列结构

文章目录

Python序列结构

列表

列表（list）是最重要的Python内置对象之一，是包含若干元素的有序连续内存空间。当列表增加或删除元素时，列表对象自动进行内存的扩展或收缩，从而保证相邻元素之间没有缝隙。Python列表的这个内存自动管理功能可以大幅度减少程序员的负担，但插入和删除非尾部元素时涉及到列表中大量元素的移动，会严重影响效率。

在非尾部位置插入和删除元素时会改变该位置后面的元素在列表中的索引，这对于某些操作可能会导致意外的错误结果。
除非确实有必要，否则应尽量从列表尾部进行元素的追加与删除操作。

在python中没有数组的概念，可以说列表是一个增强的数组。在形式上，列表的所有元素放在一对方括号[]中，相邻元素之间使用逗号分隔。如果只有一对方括号而没有任何元素则表示空列表。
在Python中，同一个列表中元素的数据类型可以各不相同，可以同时包含整数、实数、字符串等基本类型的元素，也可以包含列表、元组、字典、集合、函数以及其他任意对象。
Python列表中的元素也可以是值的引用，所以列表中各元素可以是不同类型的数据。
需要注意的是，列表的功能虽然非常强大，但是负担也比较重，开销较大，在实际开发中，最好根据实际的问题选择一种合适的数据类型，不要过于依赖列表。
列表的常用方法：
在这里插入图片描述
pop()用于删除并返回指定位置（默认是最后一个）上的元素；remove()用于删除列表中第一个值与指定值相等的元素；clear()用于清空列表中的所有元素。这3个方法也属于原地操作。另外，还可以使用del命令删除列表中指定位置的元素，同样也属于原地操作。
加法运算符+也可以实现列表增加元素的目的，但不属于原地操作，而是返回新列表，涉及大量元素的复制，效率非常低。使用复合赋值运算符 $+ =$ 实现列表追加元素时属于原地操作，与append()方法一样高效。
乘法运算符*可以用于列表和整数相乘，表示序列重复，返回新列表。运算符 $* =$ 也可以用于列表元素重复，属于原地操作。

>>> x = [1, 2, 3, 4]
>>> id(x)
54497224
>>> x = x * 2 #元素重复，返回新列表
>>> x
[1, 2, 3, 4, 1, 2, 3, 4]
>>> id(x) #地址发生改变
54603912
>>> x *= 2 #元素重复，原地进行
>>> x
[1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4]
>>> id(x) #地址不变
54603912

内置函数对列表的操作

max()、min()函数用于返回列表中所有元素的最大值和最小值，
sum()函数用于返回列表中所有元素之和；
len()函数用于返回列表中元素个数，zip()函数用于将多个列表中元素重新组合为元组并返回包含这些元组的zip对象；
enumerate()函数返回包含若干下标和值的迭代对象；
map()函数把函数映射到列表上的每个元素，filter()函数根据指定函数的返回值对列表元素进行过滤；
all()函数用来测试列表中是否所有元素都等价于True，any()用来测试列表中是否有等价于True的元素。
标准库functools中的reduce()函数以及标准库itertools中的compress()、groupby()、dropwhile()等大量函数也可以对列表进行操作。

>>> x = list(range(11)) #生成列表
>>> sum(x) #所有元素之和
55
>>> len(x) #列表元素个数
11
>>> list(zip(x, [1]*11)) #多列表元素重新组合
[(0, 1), (6, 1), (10, 1), (9, 1), (8, 1), (7, 1), (4, 1), (5, 1), (2,1), (1, 1), (3, 1)]
>>> list(zip(range(1,4))) #zip()函数也可以用于一个序列或迭代对象
[(1,), (2,), (3,)]
>>> list(zip(['a', 'b', 'c'], [1, 2])) #如果两个列表不等长，以短的为准
[('a', 1), ('b', 2)]
>>> enumerate(x) #枚举列表元素，返回enumerate对象
<enumerate object at 0x00000000030A9120>
>>> list(enumerate(x)) # 等价于list(zip(range(len(x)),x)))
[(0, 0), (1, 6), (2, 10), (3, 9), (4, 8), (5, 7), (6, 4), (7, 5), (8,2), (9, 1), (10, 3)]

列表的切片操作

（1）使用切片获取列表部分元素
使用切片可以返回列表中部分元素组成的新列表。与使用索引作为下标访问列表元素的方法不同，切片操作不会因为下标越界而抛出异常，而是简单地在列表尾部截断或者返回一个空列表，代码具有更强的健壮性。

>>> aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17]
>>> aList[::] #返回包含原列表中所有元素的新列表
[3, 4, 5, 6, 7, 9, 11, 13, 15, 17]
>>> aList[::-1] #返回包含原列表中所有元素的逆序列表
[17, 15, 13, 11, 9, 7, 6, 5, 4, 3]
>>> aList[::2] #隔一个取一个，获取偶数位置的元素
[3, 5, 7, 11, 15]
>>> aList[1::2] #隔一个取一个，获取奇数位置的元素
[4, 6, 9, 13, 17]
>>> aList[3:6] #指定切片的开始和结束位置
[6, 7, 9]

（2）使用切片为列表增加元素
可以使用切片操作在列表任意位置插入新元素，不影响列表对象的内存地址，属于原地操作。

>>> aList = [3, 5, 7]
>>> aList[len(aList):]
[]
>>> aList[len(aList):] = [9] #在列表尾部增加元素
>>> aList[:0] = [1, 2] #在列表头部插入多个元素
>>> aList[3:3] = [4] #在列表中间位置插入元素
>>> aList
[1, 2, 3, 4, 5, 7, 9]

（3）使用切片替换和修改列表中的元素。

>>> aList = [3, 5, 7, 9]
>>> aList[:3] = [] #删除列表中前3个元素
>>> aList
[9]
>>> aList = [3, 5, 7, 9]
>>> aList[:3] = [1, 2, 3] #替换列表元素，等号两边的列表长度相等
>>> aList
[1, 2, 3, 9]
>>> aList[3:] = [4, 5, 6] #切片连续，等号两边的列表长度可以不相等
>>> aList
[1, 2, 3, 4, 5, 6]
>>> aList[::2] = [0]*3 #隔一个修改一个
>>> aList
[0, 2, 0, 4, 0, 6]
>>> aList[::2] = ['a', 'b', 'c'] #隔一个修改一个
>>> aList
['a', 2, 'b', 4, 'c', 6]

列表推导

列表推导式使用非常简洁的方式来快速生成满足特定需求的列表，代码
具有非常强的可读性，很多时候可以代替map,filter等内置函数。
• 列表推导式语法形式为：

[ expression for variable in sequence if condition]
#sequence序列：列表元组之类的对象
>>> [x+y for x in 'abc' for y in 'bcd' if x!=y] # x中的每个元素和y中每个元素配对，配对的元素不能相等
['ab', 'ac', 'ad', 'bc', 'bd', 'cb', 'cd']
#例题：找出水仙花数
s = [ n for n in range(100,1000) if sum([ int(k)**3 for k in str(n)]) == n ]
print(*s)
153 370 371 407

序列解包

序列解包是一个非常重要和常用的一个功能，使用序列解包可以用非常简洁的方法完成复杂的功能。增强代码的可读性，减少代码量。

使用序列解包对多个变量同时进行赋值。

>>> x, y = y, x #交换两个变量的值
>>> x, y, z = range(3) #可以对range对象进行序列解包
>>> x, y, z = iter([1, 2, 3]) #使用迭代器对象进行序列解包
>>> x, y, z = map(str, range(3)) #使用可迭代的map对象进行序列解包

序列解包也可以适用于列表和字典呢，字典的话默认是对“key”进行操作，如需对“key”-“value”进行操作则需要使用字典的items()方法进行操作。“value”进行操作的话就使用values()进行操作。

>>> s = {'a':1, 'b':2, 'c':3}
>>> for k, v in s.items(): #字典中每个元素包含“键”和“值”两部分
print(k, v)
a 1
c 3
b 2

还可以用序列解包同时遍历多个序列

>>> keys = ['a', 'b', 'c']
>>> values = [1, 2, 3]
>>> for k, v in zip(keys, values):
print(k, v)
a 1
b 2
c 3

使用内置函数enumerate()返回的的迭代对象进行遍历时的序列解包。

>>> x = ['a', 'b', 'c']
>>> for i, v in enumerate(x):
print('The value on position {0} is {1}'.format(i,v))
The value on position 0 is a
The value on position 1 is b
The value on position 2 is c

还支持在实参面前加上一个（*）号进行序列解包，从而实现将序列中的元素值依次传递给相同数量的形参。

>>> a=[1,2,3,4]
>>> print(*a)
1 2 3 4
>>> *a
SyntaxError: can't use starred expression here
>>> print('ABC', *'ABC')
ABC A B C

字典

字典是另一种可变容器模型，且可存储任意类型对象。参考菜鸟教程。定义字典时，每个元素的“键”和“值”之间用冒号分隔，不同元素之间用逗号分隔，所有的元素放在一对大括号“｛｝”中。整个字典包括在花括号 {} 中 ,格式如下所示：

d = {key1 : value1, key2 : value2 }

字典键的特性
字典值可以没有限制地取任何python对象，既可以是标准的对象，也可以是用户定义的，但键不行。
两个重要的点需要记住：
1）不允许同一个键出现两次。创建时如果同一个键被赋值两次，后一个值会被记住；
2）键必须不可变，所以可以用数字，字符串或元组充当，所以用列表就不行。
在这里插入图片描述

元组

Python的元组与列表类似，不同之处在于元组的元素不能修改。元组使用小括号，列表使用方括号。元组创建很简单，只需要在括号中添加元素，并使用逗号隔开即可。
元组中只包含一个元素时，需要在元素后面添加逗号。

元组和列表的异同点

Python的内部实现对元组做了大量优化，访问速度比列表更快。如果定义了一系列常量值，主要用途仅是对它们进行遍历或其他类似用途，而不需要对其元素进行任何修改，那么一般建议使用元组而不用列表。
元组在内部实现上不允许修改其元素值，从而使得代码更加安全，例如调用函数时使用元组传递参数可以防止在函数中修改元组，而使用列表则很难保证这一点。

生成器推导式

生成器推导式（generator expression）的用法与列表推导式非常相似，在形式上生成器推导式使用圆括号（parentheses）作为定界符，而不是列表推导式所使用的方括号（square brackets）。
与列表推导式最大的不同是，生成器推导式的结果是一个生成器对象。生成器对象类似于迭代器对象，具有惰性求值的特点，只在需要时生成新元素，比列表推导式具有更高的效率，空间占用非常少，尤其适合大数据处理的场合。
使用生成器对象的元素时，可以根据需要将其转化为列表或元组，也可以使用生成器对象的_ next _()方法或者内置函数next()进行遍历，或者直接使用for循环来遍历其中的元素。但是不管用哪种方法访问其元素，只能从前往后正向访问每个元素，没有任何方法可以再次访问已访问过的元素，也不支持使用下标访问其中的元素。当所有元素访问结束以后，如果需要重新访问其中的元素，必须重新创建该生成器对象，enumerate、filter、map、zip等其他迭代器对象也具有同样的特点。

#使用生成器对象__next__()方法或内置函数next()进行遍历
>>> g = ((i+2)**2 for i in range(10)) #创建生成器对象
>>> g
<generator object <genexpr> at 0x0000000003095200>
>>> tuple(g) #将生成器对象转换为元组
(4, 9, 16, 25, 36, 49, 64, 81, 100, 121)
>>> list(g) #生成器对象已遍历结束，没有元素了
[]
>>> g = ((i+2)**2 for i in range(10)) #重新创建生成器对象
>>> g.__next__() #使用生成器对象的__next__()方法获取元素
4
>>> g.__next__() #获取下一个元素
9
>>> next(g) #使用函数next()获取生成器对象中的元素
16

在这里插入图片描述

集合

集合（set）是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合，元素之间使用逗号分隔，同一个集合内的每个元素都是唯一的，元素之
间不允许重复。注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。
集合中只能包含数字、字符串、元组等不可变类型（或者说可哈希）的数据，而不能包含列表、字典、集合等可变类型的数据。

#创建格式：
temp1 = {value01,value02,...}
或者
set(value)

在这里插入图片描述

集合运算

>>> a_set = set([8, 9, 10, 11, 12, 13])
>>> b_set = {0, 1, 2, 3, 7, 8}
>>> a_set | b_set #并集
{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13}
>>> a_set.union(b_set) #并集
{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13}
>>> a_set & b_set #交集
{8}
>>> a_set.intersection(b_set) #交集
{8}
>>> a_set.difference(b_set) #差集
{9, 10, 11, 12, 13}
>>> a_set - b_set
{9, 10, 11, 12, 13}
>>> a_set.symmetric_difference(b_set) #对称差集
{0, 1, 2, 3, 7, 9, 10, 11, 12, 13}
>>> a_set ^ b_set
{0, 1, 2, 3, 7, 9, 10, 11, 12, 13}