问题
怎样实现又给按优先级排序的队列?并且在队列上面每次pop操作总是返回优先级最高的那个元素
解决方案
下面的类利用heapq模块实现了一个简单的优先级队列:
import heapq
class PriorityQueue:
def __init__(self):
self._queue = []
self._index = 0
def push(self, item, priority):
heapq.heappush(self._queue, (-priority, self._index, item))
self._index += 1
def pop(self):
return heapq.heappop(self._queue)[-1]
下面 它的使用方式:
class Item:
def __init__(self, name):
self.name = name
def __repr__(self):
return 'Item({!r})'.format(self.name)
q = PriorityQueue()
q.push(Item('foo'), 1)
q.push(Item('foo'), 1)
q.push(Item("spam"),5)
q.push(Item('GROK'),1)
print(q.pop()) # -》 Item('spam')
print(q.pop()) # ->Item('foo')
print(q.pop()) # ->Item('foo')
print(q.pop()) # ->Item('GROK')
仔细观察可以发现,第一个pop()操作返回优先级最高的元素。另外注意到如果两个有着相同优先级的元素(foo,和grok),pop操作按照他们被插入到队列的顺序返回的。
讨论
这一小节我们主要是关注heapq模块的使用。函数heapq.heappush()和heapq.heappop()分别在队列_queue插入和删除第一个元素。并且队列_queue
保证第一个元素拥有最高优先级(1.4节已经讨论过这个问题)。heappop()函数总是返回“最小”的元素,这就是保证队列pop操作返回正确元素的关键,另外,由于push和pop操作时间复杂度为O(logN)其中N是堆的大小,因此计算是N很大的时候他们运行速度也依旧很快
在上面的代码中,队列包含了一个(-priority,index,item)的元组。优先级为负数的目的是使得元素按照优先级从高到低排序。这个跟普通的按照优先级从低到高排序的堆排序恰巧相反。
index变量的作用是保证等级优先级元素的正确排序。通过保存一个不断增加的index下标变量。可以确保元素按照它们插入的顺序排序。而且,index变量也在相同优先级元素比较的时候起到重要作用。