一、序列概述
Python内置了多种序列,重点两种:列表和元组。另一种重要的序列 是字符串。 列表和元组的主要不同在于,列表是可以修改的,而元组不可以。这意味着列表适用于需要中途添加元素的情形,而元组适用于出于某种考虑需要禁止修改序列的情形。禁止修改序列通常出于技术方面的考虑,与Python的内部工作原理相关,这也是有些内置函数返回元组的原因所在。在你自己编写程序时,几乎在所有情况下都可使用列表来代替元组。一种例外情况是将元组用作字典键。在这种情况下,不能使用列表来代替元组,因为字典键是不允许修改的。 在需要处理一系列值时,序列很有用。在数据库中,你可能使用序列来表示人,其中第一个元素为姓名,而第二个元素为年龄。如果使用列表来表示(所有元素都放在方括号内,并用逗号 隔开),将类似于下面这样:
edward = ['Edward Gumby', 42]
序列还可包含其他序列,因此可创建一个由数据库中所有人员组成的列表:
john = ['John Smith', 50]
database = [edward, john]
二、通用的序列操作
有几种操作适用于所有序列,包括索引、切片、相加、相乘和成员资格检查。另外,Python 还提供了一些内置函数,可用于确定序列的长度以及找出序列中大和小的元素。
1.索引
序列中的所有元素都有编号——从0开始递增。你可像下面这样使用编号来访问各个元素:
greeting = 'Hello'
print(greeting[0]) #H
字符串就是由字符组成的序列。索引0指向第一个元素,这里为字母H。不同于其他一 些语言,Python没有专门用于表示字符的类型,因此一个字符就是只包含一个元素的字符串。
这称为索引(indexing)。你可使用索引来获取元素。这种索引方式适用于所有序列。当你使 用负数索引时,Python将从右(即从后一个元素)开始往左数,因此-1是后一个元素的位置。
对于字符串字面量(以及其他的序列字面量),可直接对其执行索引操作,无需先将其赋给 变量。这与先赋给变量再对变量执行索引操作的效果是一样的。
print( 'Hello'[-1] ) #o
如果函数调用返回一个序列,可直接对其执行索引操作。例如,如果你只想获取用户输入的 年份的第4位,可像下面这样做:
fourth = input('Year: ')[3] #1989
print(fourth) #9
输入年、月(数1~12)、日(数1~31),再使用相应的月份名等将日期打印出来。
# 将以数指定年、月、日的日期打印出来
months = [ 'January',
'February',
'March',
'April',
'May',
'June',
'July',
'August',
'September',
'October',
'November',
'December'
]
# 一个列表,其中包含数1~31对应的结尾
endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
+ ['st', 'nd', 'rd'] + 7 * ['th'] \
+ ['st']
year = input('Year: ')
month= input('Month (1-12): ')
day= input('Day (1-31): ')
month_number = int(month)
day_number = int(day)
# 别忘了将表示月和日的数减1,这样才能得到正确的索引
month_name = months[month_number-1]
ordinal = day + endings[day_number-1]
print(month_name + ' ' + ordinal + ', ' + year)
2.切片
除使用索引来访问单个元素外,还可使用切片(slicing)来访问特定范围内的元素。为此, 可使用两个索引,并用冒号分隔:
tag = '<a href="http://www.python.org">Python web site</a>'
print(tag[3:6]) #hre
print(tag[32:-4])#Python web site
第一个索引是包含的第一 个元素的编号,但第二个索引是切片后余下的第一个元素的编号。
- 省略
如果切片结束于序列末尾,可省略第二个索引。
>>> numbers[-3:] [8, 9, 10]
同样,如果切片始于序列开头,可省略第一个索引。
>>> numbers[:3] [1, 2, 3]
实际上,要复制整个序列,可将两个索引都省略。
>>> numbers[:] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
- 步长
执行切片操作时,你显式或隐式地指定起点和终点,但通常省略另一个参数,即步长。在普通切片中,步长为1。这意味着从一个元素移到下一个元素,因此切片包含起点和终点之间的所有元素。
>>> numbers[0:10:1] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
在这个示例中,指定了另一个数。这显式地指定了步长。如果指定的步长大 于1,将跳过一些元素。例如,步长为2时,将从起点和终点之间每隔一个元素提取一个元素。
>>> numbers[0:10:2] [1, 3, 5, 7, 9] numbers[3:6:3] [4]
显式地指定步长时,也可使用简写。例如,要从序列中每隔3个元素提取1个,只需提供步长4即可。
>>> numbers[::4] [1, 5, 9]
当然,步长不能为0,否则无法向前移动,但可以为负数,即从右向左提取元素。
>>> numbers[8:3:-1] [9, 8, 7, 6, 5]
>>> numbers[10:0:-2] [10, 8, 6, 4, 2]
>>> numbers[0:10:-2] []
>>> numbers[::-2] [10, 8, 6, 4, 2]
>>> numbers[5::-2] [6, 4, 2]
>>> numbers[:5:-2] [10, 8]
3.序列相加
可使用加法运算符来拼接序列。
不能拼接列表和字符串,虽然它们都是序列。一般而言,不能拼接不同类 型的序列。
4.序列乘法
将序列与数x相乘时,将重复这个序列x次来创建一个新序列
None、空列表和初始化
空列表是使用不包含任何内容的两个方括号([])表示的。如果要创建一个可包含10个元素 的列表,使用[0]*10, 这将创建一个包含10个零的列表。用表示“什么都没有”的值, 如表示还没有在列表中添加任何内容。在这种情况下,可使用None。在Python中,None表示什么都没有。因此,要将列表的长度初始化为10,可像下面这样做:
>>> sequence = [None] * 10
>>> sequence [None, None, None, None, None, None, None, None, None, None]
5.成员资格
要检查特定的值是否包含在序列中,可使用运算符in。这个运算符与前面讨论的运算符(如 乘法或加法运算符)稍有不同。它检查是否满足指定的条件,并返回相应的值:满足时返回True, 不满足时返回False。这样的运算符称为布尔运算符,而前述真值称为布尔值。
>>> permissions = 'rw'
>>> 'w' in permissions
True
>>> 'x' in permissions
False
>>> users = ['mlh', 'foo', 'bar']
>>> input('Enter your user name: ') in users
Enter your user name: mlh True
>>> subject = '$$$ Get rich now!!! $$$'
>>> '$$$' in subject
True
长度、最小值和最大值
内置函数len、min和max很有用,其中函数len返回序列包含的元素个数,而min和max分别返回序列中小和大的元素
>>> numbers = [100, 34, 678]
>>> len(numbers)
3
>>> max(numbers)
678
>>> min(numbers)
34
>>> max(2,3)
3
>>> min(9,3,2,5)
2
三、列表:Python的主力
1. 函数list
鉴于不能像修改列表那样修改字符串,因此在有些情况下使用字符串来创建列表很有帮助。 为此,可使用函数list。
>>> list('Hello')
['H', 'e', 'l', 'l', 'o']
可将任何序列(而不仅仅是字符串)作为list的参数。
2.基本的列表操作
- 修改列表:给元素赋值
修改列表使用索引表示法给特定位置的元素赋值,如x[1] = 2。
>>> x = [1, 1, 1]
>>> x[1] = 2
>>> x
[1, 2, 1]
- 删除元素
从列表中删除元素也很容易,只需使用del语句即可。
>>> names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']
>>> del names[2]
>>> names
['Alice', 'Beth', 'Dee-Dee', 'Earl']
注意到Cecil彻底消失了,而列表的长度也从5变成了4。除用于删除列表元素外,del语句还可用于删除其他东西。你可将其用于字典或变量。
- 给切片赋值
>>> name = list('Perl')
>>> name
['P', 'e', 'r', 'l']
>>> name[2:] = list('ar')
>>> name
['P', 'e', 'a', 'r']
从上述代码可知,可同时给多个元素赋值。通过使用切片赋值,可将切片替换为长度与其不同的序列。
>>> name = list('Perl')
>>> name[1:] = list('ython')
>>> name
['P', 'y', 't', 'h', 'o', 'n']
使用切片赋值还可在不替换原有元素的情况下插入新元素。
>>> numbers = [1, 5]
>>> numbers[1:1] = [2, 3, 4]
>>> numbers
[1, 2, 3, 4, 5]
“替换”了一个空切片,相当于插入了一个序列。可采取相反的措施来删除 切片。
>>> numbers [1, 2, 3, 4, 5]
>>> numbers[1:4] = []
>>> numbers
[1, 5]
上述代码与del numbers[1:4]等效。
3.列表方法
- append
方法append用于将一个对象附加到列表末尾。
>>> lst = [1, 2, 3]
>>> lst.append(4)
>>> lst
[1, 2, 3, 4]
- clear
方法clear就地清空列表的内容。
>>> lst = [1, 2, 3]
>>> lst.clear()
>>> lst
[]
这类似于切片赋值语句lst[:] = []。
- copy
方法 copy 复制列表。前面说过,常规复制只是将另一个名称关联到列表。
>>> a = [1, 2, 3]
>>> b = a
>>> b[1] = 4
>>> a
[1, 4, 3]
要让a和b指向不同的列表,就必须将b关联到a的副本。
>>> a = [1, 2, 3]
>>> b = a.copy()
>>> b[1] = 4
>>> a
[1, 2, 3]
这类似于使用a[:]或list(a),它们也都复制a。
- count 方法
count计算指定的元素在列表中出现了多少次。
>>> ['to', 'be', 'or', 'not', 'to', 'be'].count('to')
2
>>> x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
>>> x.count(1)
2
>>> x.count([1, 2])
1
- extend
方法extend让你能够同时将多个值附加到列表末尾,为此可将这些值组成的序列作为参数提供给方法extend。换而言之,你可使用一个列表来扩展另一个列表。
>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6]
这可能看起来类似于拼接,但存在一个重要差别,那就是将修改被扩展的序列(这里是a)。 在常规拼接中,情况是返回一个全新的序列。
>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a + b
[1, 2, 3, 4, 5, 6]
>>> a
[1, 2, 3]
如你所见,拼接出来的列表与前一个示例扩展得到的列表完全相同,但在这里a并没有被修改。
- index
方法index在列表中查找指定值第一次出现的索引。
>>> knights = ['We', 'are', 'the', 'knights', 'who', 'say', 'ni']
>>> knights.index('who')
4
搜索单词’who’时,发现它位于索引4处。
- insert
方法insert用于将一个对象插入列表。
>>> numbers = [1, 2, 3, 5, 6, 7]
>>> numbers.insert(3, 'four')
>>> numbers
[1, 2, 3, 'four', 5, 6, 7]
- pop
方法pop从列表中删除一个元素(默认为后一个元素),并返回这一元素。
>>> x = [1, 2, 3]
>>> x.pop()
3
>>> x [1, 2]
>>> x.pop(0)
1
>>> x
[2]
- remove
方法remove用于删除第一个为指定值的元素。
>>> x = ['to', 'be', 'or', 'not', 'to', 'be']
>>> x.remove('be')
>>> x
['to', 'or', 'not', 'to', 'be']
- reverse
方法reverse按相反的顺序排列列表中的元素(我想你对此应该不会感到惊讶)。
>>> x = [1, 2, 3]
>>> x.reverse()
>>> x
[3, 2, 1]
注意到reverse修改列表,但不返回任何值(与remove和sort等方法一样)。
- sort
方法sort用于对列表就地排序。就地排序意味着对原来的列表进行修改,使其元素按顺序排列,而不是返回排序后的列表的副本。
>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort()
>>> x
[1, 2, 4, 6, 7, 9]
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.sort() # Don't do this!
>>> print(y)
None
鉴于sort修改x且不返回任何值,终的结果是x是经过排序的,而y包含None。为实现前述目标,正确的方式之一是先将y关联到x的副本,再对y进行排序,如下所示:
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.copy()
>>> y.sort()
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]
只是将x赋给y是不可行的,因为这样x和y将指向同一个列表。为获取排序后的列表的副本, 另一种方式是使用函数sorted。
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = sorted(x)
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]
实际上,这个函数可用于任何序列,但总是返回一个列表。
>>> sorted('Python')
['P', 'h', 'n', 'o', 't', 'y']
如果要将元素按相反的顺序排列,可先使用sort(或sorted),再调用方法reverse,也可使用参数reverse
- 高级排序
方法sort接受两个可选参数:key和reverse。这两个参数通常是按名称指定的,称为关键字参数。参数key类似于参数cmp:你将其设置为一个用于排序的函数。然而, 不会直接使用这个函数来判断一个元素是否比另一个元素小,而是使用它来为每个元素创建一个 键,再根据这些键对元素进行排序。因此,要根据长度对元素进行排序,可将参数key设置为函数len。
>>> x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']
>>> x.sort(key=len)
>>> x
['add', 'acme', 'aerate', 'abalone', 'aardvark']
对于另一个关键字参数reverse,只需将其指定为一个真值(True或False
),以指出是否要按相反的顺序对列表进行排序。
>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort(reverse=True)
>>> x
[9, 7, 6, 4, 2, 1]
函数sorted也接受参数key和reverse。在很多情况下,将参数key设置为一个自定义函数很有用
四、元组:不可修改的序列
>>> (1, 2, 3)
(1, 2, 3)
元组用圆括号括起
空元组用两个不包含任何内容的圆括号表示。
>>> ()
()
包含一个值的元组
>>> 42,
(42,)
>>> 3 * (40 + 2)
126
>>> 3 * (40 + 2,)
(42, 42, 42)
函数tuple的工作原理与list很像:它将一个序列作为参数,并将其转换为元组。如果参数已经是元组,就原封不动地返回它。
>>> tuple([1, 2, 3])
(1, 2, 3)
>>> tuple('abc')
('a', 'b', 'c')
>>> tuple((1, 2, 3))
(1, 2, 3)
元组的切片也是元组,就像列表的切片也是列表一样。为何要熟悉元组呢?原因有以下两个。
- 它们用作映射中的键(以及集合的成员),而列表不行。
- 有些内置函数和方法返回元组,这意味着必须跟它们打交道。只要不尝试修改元组,与 元组“打交道”通常意味着像处理列表一样处理它们(需要使用元组没有的index和count 等方法时例外)。 一般而言,使用列表足以满足对序列的需求。