题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
思路:数据容器分为两部分,容器左边部分的数据比右边的数据小。即使没有排序,也可以根据左边最大的数和右边最小的数得到中位数。因此,用最大堆实现左边的数据容器,用最小堆实现右边实现右边的数据容器。则往中间插入一个数据的时间效率是O(logn),由于只需要O(1)时间就可以得到位于栈顶的数,因此获得中位数的时间复杂度位O(1)。
python中的heapq可以构建最小堆,最大堆的话就加负号。如果总数为基数,就插入最大堆。但是由于最大堆的元素都要小于最小堆,因此当需要插入的数字比最小堆最小的数字大的话,就把数据先插入最小堆,然后把最小堆最小的元素插入最大堆。总数为偶数的时候同理。
# -*- coding:utf-8 -*-
from heapq import *
class Solution:
def __init__(self):
self.min_heap = []
self.max_heap = []
def Insert(self, num):
# write code here
if (len(self.min_heap)+len(self.max_heap))&1:
if len(self.min_heap)>0 and num>self.min_heap[0]:
heappush(self.min_heap, num)
heappush(self.max_heap, -self.min_heap[0])
heappop(self.min_heap)
else:
heappush(self.max_heap, -num)
else:
if len(self.max_heap)>0 and num<-self.max_heap[0]:
heappush(self.max_heap, -num)
heappush(self.min_heap, -self.max_heap[0])
heappop(self.max_heap)
else:
heappush(self.min_heap, num)
def GetMedian(self, n=None):
# write code here
if (len(self.min_heap)+len(self.max_heap))&1:
mid = self.min_heap[0]
else:
mid = (self.min_heap[0]-self.max_heap[0])/2.0
return mid