有很多方法可以编写计算直方图的Python程序。
我所说的直方图是指一个函数,它计算对象在iterable中的出现次数,并输出字典中的计数。例如:>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}
编写此函数的一种方法是:def histogram(L):
d = {}
for x in L:
if x in d:
d[x] += 1
else:
d[x] = 1
return d
有没有更简洁的方法来编写这个函数?
如果我们有Python中的字典理解,我们可以编写:>>> { x: L.count(x) for x in set(L) }
但由于Python2.6没有它们,我们必须编写:>>> dict([(x, L.count(x)) for x in set(L)])
尽管这种方法可能是可读的,但它并不有效:L被多次遍历。此外,这对于单生命生成器不起作用;该函数对于迭代器生成器也同样有效,例如:def gen(L):
for x in L:
yield x
我们可以尝试使用reduce函数(R.I.p.):>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # wrong!
哎呀,这不起作用:密钥名是'x',而不是x。:(一)
我的结尾是:>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})
(在Python 3中,我们必须编写list(d.items()),而不是d.items(),但这是假设的,因为那里没有reduce。)
请用一个更好,更可读的一行打我!;)