数据流中的中位数
题目
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如:
— [2,3,4] 的中位数是 3
— [2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
(1)void addNum(int num) - 从数据流中添加一个整数到数据结构中。
(2)double findMedian() - 返回目前所有元素的中位数。
- 最多会对 addNum、findMedia进行 50000 次调用。
思路1 二分查找插入:
每次将值插在合适的位置,就不用对数组排序,用二分查找来找到这个合适的位置(查找
O
(
l
o
g
n
)
O(logn)
O(logn),插入
O
(
n
)
O(n)
O(n))。
- C++ 使用lower_bound()函数:lower_bound( begin,end,num),从数组的begin位置到end-1位置二分查找第一个大于或等于num的数字,找到返回该数字的地址,不存在则返回end。
- python 使用bisect排序模块,bisect.insort_left(arr, num)会返回在arr中插入num的位置,这里不需要这个位置,只执行插入操作。
思路2 优先队列(堆):
leetcode题解参考
时间复杂度
O
(
l
o
g
n
)
O(logn)
O(logn)
总结:
两个二分查找的实现:
- C++:lower_bound()函数
- python: bisect.insort_left()
C++ 思路一
class MedianFinder {
vector<int> store;
public:
/** initialize your data structure here. */
MedianFinder() {
}
void addNum(int num) {
if(store.empty())
store.push_back(num);
else
store.insert(lower_bound(store.begin(), store.end(), num), num); //二分查找插入
}
double findMedian() {
int n = store.size();
return n&1 ? store[n/2]:(store[n/2-1]+store[n/2])*0.5;
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/
python 思路一
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.store = []
def addNum(self, num: int) -> None:
if not self.store:
self.store.append(num)
else:
bisect.insort_left(self.store, num) # 使用二分查找插入,bisect.insort_left会返回插入的位置,这里不需要这个位置,只执行插入操作
def findMedian(self) -> float:
n = len(self.store)
if n & 1 == 1: # n是奇数
return self.store[n // 2]
else:
return (self.store[n // 2] + self.store[n // 2 - 1]) / 2
# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()