如果要减少内存量,可以避免使用生成器来生成临时列表:
sum(x > 0 for x in frequencies)
这是因为True是int的子类:
>>> isinstance(True,int)
True
和True的值是1:
>>> True==1
True
但是,正如Joe Golton在评论中指出的那样,这种解决方案并不是很快。 如果您有足够的内存来使用中间临时列表,则sth的解决方案可能会更快。 以下是一些比较各种解决方案的时间:
>>> frequencies = [random.randint(0,2) for i in range(10**5)]
>>> %timeit len([x for x in frequencies if x > 0]) # sth
100 loops, best of 3: 3.93 ms per loop
>>> %timeit sum([1 for x in frequencies if x > 0])
100 loops, best of 3: 4.45 ms per loop
>>> %timeit sum(1 for x in frequencies if x > 0)
100 loops, best of 3: 6.17 ms per loop
>>> %timeit sum(x > 0 for x in frequencies)
100 loops, best of 3: 8.57 ms per loop
请注意,根据Python,操作系统或硬件的版本,时间结果可能会有所不同。
当然,如果要对大量数字进行数学运算,则可能应该使用NumPy:
>>> frequencies = np.random.randint(3, size=10**5)
>>> %timeit (frequencies > 0).sum()
1000 loops, best of 3: 669 us per loop
NumPy数组比等效的Python列表所需的内存更少,并且可以比任何纯Python解决方案更快地执行计算。