1、合并列表(extend)
跟元组一样,用加号(+)将两个列表加起来即可实现合并:
-
In [
1]: x=list(range(
1,
13,
2))
-
In [
2]: x + [
'b',
'a']
-
Out[
2]: [
1,
3,
5,
7,
9,
11,
'b',
'a']
对于已定义的列表,可以用extend方法一次性添加多个元素:
-
In [
7]: x2=[
3,
6,
1]
-
In [
8]: x.extend(x2)
-
In [
9]: x
-
Out[
9]: [
1,
3,
5,
7,
9,
11,
3,
6,
1,
3,
6,
1,
3,
6,
1]
需要说明的是:加号(+)执行列表的合并是非常浪费资源的,因为必须创建一个新列表并将所有对象复制过去,而用extend将元素附加到现有列表(尤其是在构建一个大列表时)就会好很多。
因此,在进行列表合并操作时,尤其是对于大数据量的列表合并,强烈建议使用extend函数。
2、列表排序(sort)
列表的sort方法可以实现就地排序(无需创建新对象,字符串按首字母进行排序):
-
In [
10]: a=[
1,
5,
3,
-3,
0]
-
-
In [
11]: a.sort()
-
-
In [
12]: a
-
Out[
12]: [
-3,
0,
1,
3,
5]
-
-
In [
13]: s=[
'a',
'ab',
'3e',
'z']
-
-
In [
14]: s.sort()
-
-
In [
15]: s
-
Out[
15]: [
'3e',
'a',
'ab',
'z']
sort有几个很好用的选项,一个是次要排序键,即一个能够产生可用于排序的值的函数。如可以通过长度对一组字符串进行排序:
-
In [
16]: b=[
'a',
'nl',
'drz',
'mowgt',
'aa']
-
-
In [
17]: b.sort(key=len)
-
-
In [
18]: b
-
Out[
18]: [
'a',
'nl',
'aa',
'drz',
'mowgt']
再比如是否进行降序排列,如下面通过对首字母进行降序排列的示例:
-
In [
21]: b.sort(key=
lambda x:x[
0], reverse=
True)
-
-
In [
22]: b
-
Out[
22]: [
'nl',
'mowgt',
'drz',
'a',
'aa']
3、 二分搜索及维护有序列表(bisect)
内置的bisect模块实现了二分查找以及对有序列表的插入操作。bisect.bisect可以找出新元素应该被插入到哪个位置以保持元列表的有序性,bisect.insort则将新元素插入到那个正确的位置上。
-
In [
23]:
import bisect
-
-
In [
24]: c=[
1,
2,
1,
-1,
4,
5]
-
-
In [
25]: c.sort()
-
-
In [
26]: bisect.bisect(c,
2)
-
Out[
26]:
4
-
-
In [
27]: bisect.insort(c,
4)
-
-
In [
28]: c
-
Out[
28]: [
-1,
1,
1,
2,
4,
4,
5]
注意:bisect模块的函数不会判断原列表是否有序,因为这样做开销太大;因此将他们用作无序列表时虽然不会出错,但可能会导致不正确的结果。基于此,建议在使用bisect模块的函数前,先对原列表执行排序的操作。
3、切片(索引运算符[]及start:stop)
可以对序列类型(数组、列表、元组等)进行切片操作,start索引处元素被包括在切片的结果中,stop索引处的元素未被包括在结果中,元素数量为 stop-start。start或stop都是可以省略的,此时他们分别默认为序列的起始处和结尾处。
还可以在第二个冒号后加上步长(step),比如每隔一位取一个元素:
-
In [
35]: d=[x
for x
in range(
10)]
-
-
In [
36]: d
-
Out[
36]: [
0,
1,
2,
3,
4,
5,
6,
7,
8,
9]
-
-
In [
37]: e=d[:
8:
2]
-
-
In [
38]: e
-
Out[
38]: [
0,
2,
4,
6]
可以巧妙的使用 -1 ,实现对列表或元素的反序,如下:
-
In [
40]: f=d[::
-1]
-
-
In [
41]: f
-
Out[
41]: [
9,
8,
7,
6,
5,
4,
3,
2,
1,
0]
4、列表内置的序列函数
4.1 enumerate
enumerate函数可以逐个返回序列的(i, value)元组,如下示例:
-
In [
43]:
#for i value in enumerate(collection):
-
-
In [
44]:
#用 i, value 做一些事情
-
In [
49]: slist=[
'qin',
'wang',
'wqc']
-
-
In [
50]: mapping = dict((v, i)
for i, v
in enumerate(list))
-
-
In [
51]: mapping
-
Out[
51]: {
'qin':
0,
'wang':
1,
'wqc':
2}
4.2 sorted
sorted函数可以将任何序列返回为一个新的有序列表(注意:sort函数是就地排序),如下:
-
In [
59]: sorted([
'z',
'd',
'c',
'n'])
-
Out[
59]: [
'c',
'd',
'n',
'z']
-
-
In [
60]: sorted(
'my name is chaogo')
-
Out[
60]:
-
[
' ',
-
' ',
-
' ',
-
'a',
-
'a',
-
'c',
-
'e',
-
'g',
-
'h',
-
'i',
-
'm',
-
'm',
-
'n',
-
'o',
-
'o',
-
's',
-
'y']
常常将sorted和set结合起来使用以得到一个由序列中的唯一元素构成的有序列表:
-
In [
61]: set(sorted(
'my name is chaogo'))
-
Out[
61]: {
' ',
'a',
'c',
'e',
'g',
'h',
'i',
'm',
'n',
'o',
's',
'y'}
-
-
In [
62]: sorted(set(
'my name is chaogo'))
-
Out[
62]: [
' ',
'a',
'c',
'e',
'g',
'h',
'i',
'm',
'n',
'o',
's',
'y']
-
-
In [
63]: set(
'my name is chaogo')
-
Out[
63]: {
' ',
'a',
'c',
'e',
'g',
'h',
'i',
'm',
'n',
'o',
's',
'y'}
上面的结果都是一样的,什么原因呢?这是因为:(1)set和sorted是对序列进行操作,当参数不是序列时,会默认转换为列表;(2)set默认会对元素进行排序。
4.3 zip
zip用于将多个序列(列表、元组等)中的元素“配对”,从而产生一个新的元组列表;zip可以接受任意数量的序列,最终得到的元组数量由最短的序列决定;zip最常见的用法是同时迭代多个序列,还可以结合enumerate一起使用,如下:
-
In [
77]: seq1 = [
'chao',
'qing',
'wq']
-
-
In [
78]: seq2 = [
'qin',
'wang',
'qc']
-
-
In [
79]:
for i , (a,b)
in enumerate(zip(seq1, seq2)):
-
...: print(
'%d: %s %s' % (i, a, b))
-
...:
-
0: chao qin
-
1: qing wang
-
2: wq qc
对于“已压缩的”(zipped)序列,zip还有一个很巧妙的用法,即对该序列进行解压(unzip,用*表示)。其实就是将一组行转换为一组列,如下:
-
In [
86]: pitchers = [(
'a',
'b'), (
1,
2), (
'tmd',
'bat')]
-
-
In [
87]: one, two = zip(*pitchers)
-
-
In [
88]: one
-
Out[
88]: (
'a',
1,
'tmd')
-
-
In [
89]: two
-
Out[
89]: (
'b',
2,
'bat')
4.4 reversed
用于按逆序迭代序列中的元素,如下:
-
In [
92]: [x
for x
in reversed([
1,
2,
5,
3,
-1])]
-
Out[
92]: [
-1,
3,
5,
2,
1]