在python序列上执行聚集函数的计算,一般需要对序列数据进行转换或者过滤,例如:
常规方式:采用生成器表达式,通过for循环将序列每一个元素取出来进行计算,然后存放到一个列表里,列表是一个可迭代对象,可采用聚集函数进行计算,如下:
nums = [1, 2, 3, 4, 5]
s = sum([x ** 2 for x in nums])
print(s)
改进方式:当生成器表达式作为一个单独参数传递给函数时候,省略了一个括号
s = sum(x * x for x in nums)
print(s)
常规方式同样可以达到想要的效果,但是它会多一个步骤,先创建一个额外的列表。对于小型列表可能没什么关系,但是如果元素数量非常大的时候,它会创建一个巨大的仅仅被使用一次就被丢弃的临时数据结构。而生成器方案会以迭代的方式转换数据,因此更省内存。
在使用一些聚集函数比如 min() 和 max() 的时候你可能更加倾向于使用生成器版本,它们接受的一个 key 关键字参数或许对你很有帮助
例如其他例子:
data=min(share["shares"]for share in portfolio)
print(data)
打印结果:20
或者接受一个关键字参数
data_1=min(portfolio,key=lambda x :x["shares"])
print(data_1)
打印结果:{'name': 'AOL', 'shares': 20}