你所描述的是一个非常普遍的模式,线性搜索。我同意上面的blckknight的观点,即dict最适合你想做的事情。但是,在Python中确实存在这样的场景:您需要像前面描述的那样进行线性搜索,而我们没有对源或卷的控制。在这些情况下,我认为Python一方面鼓励您避免使用高阶函数函数,比如filter以便于理解,更具体地说,是生成器。在
考虑一个生成器表达式:generator = (a in range(10)) # (a in range(10)) would be pointless in real code
生成器表达式(我相信它在Python中的大多数理解中都有)定义了一种生成序列的方法,但还没有生成它,而且在处理大型数据集时非常重要,它不会将整个序列放入内存中。在
您可以将其与内置函数next结合使用。在
^{pr2}$
只要生成器没有耗尽,next将返回下一个值并推进生成器。如果生成器耗尽,它将引发一个StopIterationError,或者如果您提供了默认值,它将返回该值。在
^{3}$
真正的乐趣来自于当你考虑你可以用生成器表达式做的所有事情。生成器表达式本质上是一个内联for循环。您可以使用if语句从序列中删除不需要的术语,并且可以嵌套它们(这可能会损害易读性)。在(i for i in range(1, 13) if i % 3 == 0) # 3, 6, 9, 12
((a, b) for a in range(3) for b in range(3)) # (0, 0), (1, 0), (2, 0), (0, 1) ...
基本上,对于Python中的线性搜索,我建议:data = (datum for datum in source if datum["id"] == id)
desired = next(data, None)