问题
你有一个字典列表,你想根据某个或某几个字典字段来排序这个列表。
解决方案
通过使用operator模块的itemgetter函数,可以非常容易的排序这样的数据结构。假设你从数据库中检索出来网站会员信息列表,并且以下数据结构返回:
rows = [
{'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
{'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
{'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}]
from operator import itemgetter
rows_by_fname = sorted(rows, key=itemgetter('fname'))
print(rows_by_fname)
# [{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}]
rows_by_uid = sorted(rows, key=itemgetter('uid'))
print(rows_by_uid)
# [{'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}]
itemgetter()函数也支持多个keys(),比如下面的代码
rows_by_lfname=sorted(rows,key=itemgetter('lname','fname'))
print(rows_by_lfname)
#[{'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}]
讨论
在上面例子中,rows被传递给接受一个关键字参数的sorted()内置函数。这个参数是callable类型,并且从rows中接受一个单元一个元素,然后返回被用来排序的值。itemgetter()函数就是负责创建这个callable对象的。
operator.itemgetter()函数有一个被rows中的记录用来查找值的索引参数。可以是一个字典键名称,一个整形值或者任何能够传入一个值的__getitem__()
方法的值。如果你传入多个索引参数给itemgetter(),它生成的callable对象会返回一个包含所有元素值的元组,并且sorted()函数会根据这个元组中的顺序去排序。但你想要同时在几个字段上面进行排序(比如通过姓和名来排序,也就是例子中的那样)的时候这种方法是很有用的。
itemgetter()有时候也可以用lambda表达式替代,比如:
rows_by_fname=sorted(rows,key=lambda r:r['fname'])
print(rows_by_fname)
#[{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}]
rows_by_lfname=sorted(rows,key=lambda r:(r['lname'],r['fname']))
print(rows_by_lfname)
# [{'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}]
这种方案也不错,但是,使用itemgetter()方式会运行的稍微快点。因此,如果你对性能要求比较高的话,使用itemgetter()方式
最后,不要忘记这节中展示的技术同样也适用于min()和max()等函数,比如
print(min(rows,key=itemgetter('uid')))
#'fname': 'John', 'lname': 'Cleese', 'uid': 1001}
print(max(rows,key=itemgetter('uid')))
#{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}