什么是列表解析式?
列表解析式是将一个列表(实际上适用于任何可迭代对象(iterable
))转换成另一个列表的工具。在转换过程中,可以指定元素必须符合一定的条件,才能添加至新的列表中,这样每个元素都可以按需要进行转换。
如果你熟悉函数式编程(functional programming),你可以把列表解析式看作为结合了filter函数
与map函数
功能的语法糖:
>>> doubled_odds = map(lambda n: n * 2, filter(lambda n: n % 2 == 1, numbers))
>>> doubled_odds = [n * 2 for n in numbers if n % 2 == 1]
从循环到解析式
每个列表解析式都可以重写为for循环,但不是每个for循环都能重写为列表解析式。
掌握列表解析式使用时机的关键,在于不断练习识别那些看上去像列表解析式的问题(practice identifying problems that smell like list comprehensions)。
如果你能将自己的代码改写成类似下面这个for循环的形式,那么你也就可以将其改写为列表解析式:
new_things = []
for ITEM in old_things:
if condition_based_on(ITEM):
new_things.append("something with " + ITEM)
可以将上面的for循环改写成这样的列表解析式:
new_things = ["something with " + ITEM for ITEM in old_things if condition_based_on(ITEM)]
嵌套循环
那么嵌套循环(nested loop)又该怎样改写为列表解析式呢?
下面是一个拉平(flatten)矩阵(以列表为元素的列表)的for循环:
flattened = []
for row in matrix:
for n in row:
flattened.append(n)
下面这个列表解析式实现了相同的功能:
flattened = [n for row in matrix for n in row]
如果要在列表解析式中处理嵌套循环,请记住for循环子句的顺序与我们原来for循环的顺序是一致的。
同样地原则也适用集合解析式(set comprehension)和字典解析式(dictionary comprehension)。
其他解析式
下面的代码提取单词序列中每个单词的首字母,创建了一个集合(set):
first_letters = set()
for w in words:
first_letters.add(w[0])
同样的代码可以改写为集合解析式:
first_letters = {w[0] for w in words}
下面的代码将原有字典的键和值互换,从而创建了一个新的字典:
flipped = {}
for key, value in original.items():
flipped[value] = key
同样的代码可以改写为字典解析式:
flipped = {value: key for key, value in original.items()}
还要注意可读性
你有没有发现上面的列表解析式读起来很困难?我经常发现,如果较长的列表解析式写成一行代码,那么阅读起来就非常困难。
不过,还好Python支持在括号和花括号之间断行。
-
列表解析式 List comprehension
断行前:doubled_odds = [n * 2 for n in numbers if n % 2 == 1]
断行后:
doubled_odds = [ n * 2 for n in numbers if n % 2 == 1] ]
-
带嵌套循环的列表解析式
断行前:flattened = [n for n in row for row in matrix]
断行后:
flattened = [ n for row in matrix for n in row ]
列表生成式,是Python内置的一种极其强大的生成list的表达式。
如果要生成一个list [1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9] 可以用 range(1 , 10):
>>> range(1, 9)
[1, 2, 3, 4, 5, 6, 7, 8]
可是,如果要生成[11 , 22 , 33 , … , 1010] 怎么做呢?可以使用循环:
>>> L= []
>>> for x in range(1 , 10):
... L.append(x*x)
...
>>> L
[1, 4, 9, 16, 25, 36, 49, 64, 81]
而列表生成式,可以用一句代替以上的繁琐循环来完成上面的操作:
>>> print [x*x for x in range(1 , 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
>>>
列表生成式的书写格式:[xx for x in range(1 , 11)]
第一:把要生成的元素 xx 放到前面
第二:后面跟上for循环
这样就可以把list创建出来。
for循环后面还可以加上if判断,这样可以筛选出偶数的平方:
>>> [x*x for x in range(1 , 11) if x%2 == 0]
[4, 16, 36, 64, 100]
>>>
当然,可以使用两层循环,生成全排列:
>>> print [m + n for m in 'ABCD' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ', 'DX', 'DY', 'DZ']
>>>
如何使用两个变量来生成list:
d = {'Java':"99" , 'C':"99" , 'C++':"99" }
L = [k+'='+v for k , v in d.iteritems()]
print L