每次看大牛的代码很奇怪,比如T=[(x,y) for x in range(5) if x%2==0 for y in range(5) if y %2==1]
这是什么鬼,一个变量T为什么搞得这么拥挤,看着也累啊,后来查了一下才知道这个叫推导式。
推导式是可以从一个数据序列构建另一个新的数据序列的结构体。
【列表推导式】
列表推导能非常简洁的构造一个新列表:只用一条简洁的表达式即可对得到的元素进行转换变形
其基本格式如下:
代码如下:[expr for value in collection ifcondition]
过滤条件可有可无,取决于实际应用,只留下表达式;相当于下面这段for循环:
代码如下:
result = []
for value in collection:
if condition:
result.append(expression)
例1: 过滤掉长度小于3的字符串列表,并将剩下的转换成大写字母
代码如下:
>>> names = ['bob','tom','alice','jerry','wendy','smith']
>>> [name.upper() for name in names if len(name)>3]
['alice', 'jerry', 'wendy', 'smith']
例2: 求(x,y)其中x是0-5之间的偶数,y是0-5之间的奇数组成的元祖列表
代码如下:
>>> [(x,y) for x in range(5) if x%2==0 for y in range(5) if y %2==1]
[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]
例3: 求m中3,6,9组成的列表
代码如下:
>>> m = [[1,2,3],
... [4,5,6],
... [7,8,9]]
>>> m
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> [row[2] for row in m]
[3, 6, 9]
#或者用下面的方式
>>> [m[row][2] for row in (0,1,2)]
[3, 6, 9]
例4: 求m中斜线1,5,9组成的列表
代码如下:
>>> m
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> [m[i][i] for i in range(len(m))]
[1, 5, 9]
例5: 求m,n中矩阵和元素的乘积
代码如下:
>>> m = [[1,2,3],
... [4,5,6],
... [7,8,9]]
>>> n = [[2,2,2],
... [3,3,3],
... [4,4,4]]
>>> [m[row][col]*n[row][col] for row in range(3) for col in range(3)]
[2, 4, 6, 12, 15, 18, 28, 32, 36]
>>> [[m[row][col]*n[row][col] for col in range(3)] for row in range(3)]
[[2, 4, 6], [12, 15, 18], [28, 32, 36]]
>>> [[m[row][col]*n[row][col] for row in range(3)] for col in range(3)]
[[2, 12, 28], [4, 15, 32], [6, 18, 36]]
例5: 讲字典中age键,按照条件赋新值
代码如下:
>>> bob
{'pay': 3000, 'job': 'dev', 'age': 42, 'name': 'bob smith'}
>>> sue
{'pay': 4000, 'job': 'hdw', 'age': 45, 'name': 'sue jones'}
>>> people = [bob, sue]
>>> [rec['age']+100 if rec['age'] >= 45 else rec['age'] for rec in people] # 注意for位置
[42, 145]
例6,如下的列表推导式结合两个列表的元素,如果元素之间不相等的话:
>>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
等同于:
>>> combs = []
>>> for x in [1,2,3]:
... for y in [3,1,4]:
... if x != y:
... combs.append((x, y))
...
>>> combs
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
值得注意的是在上面两个方法中的
for
和
if
语句的顺序。
如果想要得到一个元组 (例如,上面例子中的 (x, y)),必须要加上括号:
>>> vec = [-4, -2, 0, 2, 4]
>>> # create a new list with the values doubled
>>> [x*2 for x in vec]
[-8, -4, 0, 4, 8]
>>> # filter the list to exclude negative numbers
>>> [x for x in vec if x >= 0]
[0, 2, 4]
>>> # apply a function to all the elements
>>> [abs(x) for x in vec]
[4, 2, 0, 2, 4]
>>> # call a method on each element
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']
>>> # create a list of 2-tuples like (number, square)
>>> [(x, x**2) for x in range(6)]
[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]
>>> # the tuple must be parenthesized, otherwise an error is raised
>>> [x, x**2 for x in range(6)]
File "<stdin>", line 1, in ?
[x, x**2 for x in range(6)]
^
SyntaxError: invalid syntax
>>> # flatten a list using a listcomp with two 'for'
>>> vec = [[1,2,3], [4,5,6], [7,8,9]]
>>> [num for elem in vec for num in elem]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
列表推导式可使用复杂的表达式和嵌套函数:
>>> from math import pi
>>> [str(round(pi, i)) for i in range(1, 6)]
['3.1', '3.14', '3.142', '3.1416', '3.14159']
列表推导式可以嵌套。
考虑以下的 3x4 矩阵,一个列表中包含三个长度为4的列表:
>>> matrix = [
... [1, 2, 3, 4],
... [5, 6, 7, 8],
... [9, 10, 11, 12],
... ]
现在,如果你想交换行和列,可以用嵌套的列表推导式:
>>> [[row[i] for row in matrix] for i in range(4)]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
像前面看到的,嵌套的列表推导式是对 for 后面的内容进行求值,所以上例就等价于:
>>> transposed = []
>>> for i in range(4):
... transposed.append([row[i] for row in matrix])
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
反过来说,如下也是一样的:
>>> transposed = []
>>> for i in range(4):
... # the following 3 lines implement the nested listcomp
... transposed_row = []
... for row in matrix:
... transposed_row.append(row[i])
... transposed.append(transposed_row)
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
在实际中,你应该更喜欢使用内置函数组成复杂流程语句。对此种情况 zip() 函数将会做的更好:
>>> list(zip(*matrix))
[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]
【字典推导式】
字典和集合推导式是该思想的延续,语法差不多,只不过产生的是集合和字典而已。其基本格式如下:
代码如下:{ key_expr: value_expr for value in collection if condition }
例1: 用字典推导式以字符串以及其长度建字典
代码如下:
>>> strings = ['import','is','with','if','file','exception']
>>> d = {key: val for val,key in enumerate(strings)}
>>> d
{'exception': 5, 'is': 1, 'file': 4, 'import': 0, 'with': 2, 'if': 3}
【集合推导式】
集合推导式跟列表推导式非常相似,唯一区别在于用{}代替[]。其基本格式如下:
代码如下:
{ expr for value in collection if condition }
例1: 用集合推导建字符串长度的集合
代码如下:
>>> strings = ['a','is','with','if','file','exception']
>>> {len(s) for s in strings} #有长度相同的会只留一个,这在实际上也非常有用
set([1, 2, 4, 9])
【嵌套列表推导式】
嵌套列表是指列表中嵌套列表,比如说:
代码如下:
>>> l = [[1,2,3],
[4,5,6],
[7,8,9]]
例1: 一个由男人列表和女人列表组成的嵌套列表,取出姓名中带有两个以上字母e的姓名,组成列表
代码如下:
names = [['tom','billy','jefferson','andrew','wesley','steven','joe'],
['alice','jill','ana','wendy','jennifer','sherry','eva']]
用for循环实现:
代码如下:
tmp = []
for lst in names:
for name in lst:
if name.count('e') >= 2:
tmp.append(name)
print tmp
#输出结果
>>>
['jefferson', 'wesley', 'steven', 'jennifer']
用嵌套列表实现:
代码如下:
>>> names = [['tom','billy','jefferson','andrew','wesley','steven','joe'],
['alice','jill','ana','wendy','jennifer','sherry','eva']]
>>> [name for lst in names for name in lst if name.count('e')>=2] #注意遍历顺序,这是实现的关键
['jefferson', 'wesley', 'steven', 'jennifer']
下面再转一篇推导式
列表推导式。
Tools
1ea python
1 平方列表
如果你想创建一个包含1到10的平方的列表,你可以这样做:
1
2
3
|
squares
=
[
]
for
x
in
range
(
10
)
:
squares
.
append
(
x
*
*
2
)
|
这是一个简单的例子,但是使用列表生成式可以更简洁地创建这个列表。
1
|
squares
=
[
x
*
*
2
for
x
in
range
(
10
)
]
|
这个最简单的列表生成式由方括号开始,方括号内部先是一个表达式,其后跟着一个for语句。列表生成式总是返回一个列表。
2 整除3的数字列表
通常,你可能这样写:
1
2
3
4
|
numbers
=
[
]
for
x
in
range
(
100
)
:
if
x
%
3
==
0
:
numbers
.
append
(
x
)
|
你可以在列表生成式里包含一个if语句,来有条件地为列表添加项。为了创建一个包含0到100间能被3整除的数字列表,可以使用列表推导式:
1
|
numbers
=
[
x
for
x
in
range
(
100
)
if
x
%
3
==
0
]
|
3 找出质数
这通常要使用好几行代码来实现。
1
2
3
4
5
6
7
8
|
noprimes
=
[
]
for
i
in
range
(
2
,
8
)
:
for
j
in
range
(
i
*
2
,
50
,
i
)
:
noprimes
.
append
(
j
)
primes
=
[
]
for
x
in
range
(
2
,
50
)
:
if
x
not
in
noprimes
:
primes
.
append
(
x
)
|
不过,你可以使用两个列表生成式来简化代码。
1
2
|
noprimes
=
[
j
for
i
in
range
(
2
,
8
)
for
j
in
range
(
i
*
2
,
50
,
i
)
]
primes
=
[
x
for
x
in
range
(
2
,
50
)
if
x
not
in
noprimes
]
|
第一行代码在一个列表生成式里使用了多层for循环。第一个循环是外部循环,第二个循环是是内部循环。为了找到质数,我们首先找到一个非质数的列表。通过找出2-7的倍数来产生这个非质数列表。然后我们循环遍历数字并查看每个数字是否在非质数列表。
修正:正如reddit上的shoyer指出的,使用集合(set)来查找noprimes(代码里的属性参数,译者注)效率更高。由于noprimes应该只包含唯一的值,并且我们频繁地去检查一个值是否存在,所以我们应该使用集合。集合的使用语法和列表的使用语法类似,所以我们可以这样使用:
1
2
|
noprimes
=
set
(
j
for
i
in
range
(
2
,
8
)
for
j
in
range
(
i
*
2
,
50
,
i
)
)
primes
=
[
x
for
x
in
range
(
2
,
50
)
if
x
not
in
noprimes
]
|
4 嵌套列表降维
假设你有一个列表的列表(列表里包含列表)或者一个矩阵,
1
|
matrix
=
[
[
0
,
1
,
2
,
3
]
,
[
4
,
5
,
6
,
7
]
,
[
8
,
9
,
10
,
11
]
]
|
并且你想把它降维到一个一维列表。你可以这样做:
1
2
3
4
|
flattened
=
[
]
for
row
in
matrix
:
for
i
in
row
:
flattened
.
append
(
i
)
|
使用列表生成式:
1
|
flattened
=
[
i
for
row
in
matrix
for
i
in
row
]
|
这使用了两个for循环去迭代整个矩阵。外层(第一个)循环按行迭代,内部(第二个)循环对该行的每个项进行迭代。
5 模拟多个掷硬币事件
假设需要模拟多次掷硬币事件,其中0表示正面,1表示反面,你可以这样编写代码:
1
2
3
4
|
from
random
import
random
results
=
[
]
for
x
in
range
(
10
)
:
results
.
append
(
int
(
round
(
random
(
)
)
)
)
|
或者使用列表生成式使代码更简洁:
1
2
|
from
random
import
random
results
=
[
int
(
round
(
random
(
)
)
)
for
x
in
range
(
10
)
]
|
这里使用了range函数循环了10次。每一次我们都把random()的输出进行四舍五入。因为random()函数返回一个0到1的浮点数,所以对输出进行四舍五入就会返回0或者1。Round()函数返回一个浮点型数据,使用int()将其转为整型并添加到列表里。
6 移除句子中的元音字母
假设你有一个句子,
1
|
sentence
=
'Your mother was a hamster'
|
并且你想移除所有的元音字母。我们可以使用几行代码轻易做到:
1
2
3
4
5
6
|
vowels
=
'aeiou'
non_list
=
[
]
for
l
in
sentence
:
if
not
l
in
vowels
:
non_list
.
append
(
l
)
nonvowels
=
''
.
join
(
non_list
)
|
或者你可以使用列表生成式简化它:
1
2
|
vowels
=
'aeiou'
nonvowels
=
''
.
join
(
[
l
for
l
in
sentence
if
not
l
in
vowels
]
)
|
这个例子使用列表生成式创建一个字母列表,字母列表的字母来自sentence句子的非元音字母。然后我们把生成的列表传给join()函数去转换为字符串。
修正:正如reddit上的iamadogwhatisthis提出的,这个例子不需要列表生成式。使用生成器(generator)更好:
1
2
|
vowels
=
'aeiou'
nonvowels
=
''
.
join
(
l
for
l
in
sentence
if
not
l
in
vowels
)
|
注意,这里去掉了方括号。这是因为join函数接收任意可迭代的数据,包括列表或者生成器。这个没有方括号的语法使用了生成器。这产生(与列表生成式)同样的结果,相对于之前把所有条目包装成一个列表,生成器在我们遍历时才产生相应的条目。这可以使我们不必保存整个列表到内存,并且这对于处理大量数据更有效率。
7 获取目录里的文件名列表
下面的代码将会遍历my_dir目录下的文件,并在files里追加每个以txt为后缀的文件名。
1
2
3
4
5
|
import
os
files
=
[
]
for
f
in
os
.
listdir
(
'./my_dir'
)
:
if
f
.
endswith
(
'.txt'
)
:
files
.
append
(
f
)
|
这同样可以使用列表生成式简化代码:
1
2
|
import
os
files
=
[
f
for
f
in
os
.
listdir
(
'./my_dir'
)
if
f
.
endswith
(
'.txt'
)
]
|
或者你可以获取一个相对路径的列表:
1
2
|
import
os
files
=
[
os.path
.
join
(
'./my_dir'
,
f
)
for
f
in
os
.
listdir
(
'./my_dir'
)
if
f
.
endswith
(
'.txt'
)
]
|
感谢reddit上的rasbt提供。
8 将csv文件读取为字典列表
我们常常需要读取和处理csv文件的数据。处理csv数据的一个最有用的方法就是把它转换为一个字典列表。
1
2
3
4
|
import
csv
data
=
[
]
for
x
in
csv
.
DictReader
(
open
(
'file.csv'
,
'rU'
)
)
:
data
.
append
(
x
)
|
你可以使用列表生成式快速实现:
1
2
|
import
csv
data
=
[
x
for
x
in
csv
.
DictReader
(
open
(
'file.csv'
,
'rU'
)
)
]
|
DictReader类将会自动地使用csv文件的第一行作为字典的key属性名。DictReader类返回一个将会遍历csv文件所有行的对象。这个文件对象通过open()函数产生。我们提供了open()两个参数–第一个是csv文件名,第二个是模式。在这例子,‘rU’有两个意思。想往常一样,‘r’表示以读模式打开文件。‘U’表明我们将会接受通用换行符–‘n’,‘r’和‘rn’。
感谢reddit上的blacwidonsfw提供。