题目链接: https://leetcode-cn.com/problems/find-median-from-data-stream
难度:困难
通过率:37.9%
题目描述:
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
- 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
- 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
思路:
思路一:二分法
使用二分法插入,使得数据流是有序的
插入时间复杂度:
查找:
import bisect
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.data = []
def addNum(self, num: int) -> None:
bisect.insort_left(self.data, num)
def findMedian(self) -> float:
n = len(self.data)
mid = (n - 1) // 2
if n % 2 == 1:
return self.data[mid]
else:
return (self.data[mid] + self.data[mid + 1]) / 2
思路二:堆
我们用两个堆, 一个最小堆,一个最大堆
我们把数据分成两部分,求中位数就是前半部分的最大值,后半部分的最小值。
当数据流为奇数个时候,说明最小堆个数,和最大堆个数要不一样,我们把这个数放在哪个堆里,其实都一样的,这里我放在后半部分(最小堆)
我们每次入堆,都有从另一个堆里挤出一个元素,保证最小堆和最大堆是数据流前后两部分
插入时间复杂度:
查找:
import heapq
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.max_heap = []
self.min_heap = []
def addNum(self, num: int) -> None:
if len(self.max_heap) == len(self.min_heap):
heapq.heappush(self.min_heap, -heapq.heappushpop(self.max_heap, -num))
else:
heapq.heappush(self.max_heap, -heapq.heappushpop(self.min_heap, num))
def findMedian(self) -> float:
if len(self.max_heap) == len(self.min_heap):
return (self.min_heap[0] - self.max_heap[0]) / 2
else:
return self.min_heap[0]
更多题解:
九四干:[LeetCode] 题目汇总(持续更新)zhuanlan.zhihu.com