295.数据流的中位数

本文探讨了一道关于数据流中位数计算的算法问题,初始的解决方案是通过排序列表来找到中位数,但这种方法在处理大量数据时效率低下,导致超时。接着,提出了使用优先队列(最小堆和最大堆)来优化这个问题。通过维护两个堆的平衡,确保最大堆的顶部元素小于等于最小堆的顶部元素,从而实时获取中位数。这种优化方法成功解决了超时问题,实现了高效的数据流中位数计算。
摘要由CSDN通过智能技术生成

295.数据流的中位数

image-20210827202533902

初见此题,笔者甚至怀疑这道题为何为“困难”题。笔者最初思路如下:

  • 建立一个列表,将新增的数放入列表。
  • 对列表进行排序,根据列表的长度,返回相应中位数。
class MedianFinder {
    List<Integer> list = new ArrayList();
    /** initialize your data structure here. */
    public MedianFinder() {

    }
    
    public void addNum(int num) {
            list.add(num);
    }
    
    public double findMedian() {
        double ans = 0;
        Collections.sort(list);
        int num = list.size();
        if(num % 2 == 0){
            ans = ((double)(list.get(num/2) + (double)(list.get(num/2-1)))/2);
        }
        if(num == 1) ans = (double)list.get(0);
        if(num % 2 != 0){
            ans = (double)(list.get(num/2));
        }
        return ans;
    }
}

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder obj = new MedianFinder();
 * obj.addNum(num);
 * double param_2 = obj.findMedian();
 */

很遗憾,超时了。

image-20210827202918035

对于大量数据的读取,对列表进行排序明显时间需求过长。那么如何快速得到一个排好的序列,同时得到它的中位数呢?

答案就是——优先队列。

利用优先队列,我们能够在数据在加入时就对其进行排序,那么此时还存在一个问题:如何从优先队列中取得中位数呢?

我们能不能将这段序列放置于两个大小均等的优先队列中,一个为最小堆,一个为最大堆,那么我们能不能使这两个堆的堆顶为中位数呢?是可以的。

  • 最小堆的堆顶元素需大于等于最大堆的堆顶元素。

  • 两个堆的大小相差不能超过一。

    • 为保证两个堆的大小相近,我们每次对数据进行增添时,需进行判断,确定进入哪个堆,同时保证上一个条件成立。

       if(min.size() == max.size()){
                 min.offer(num);
                 /*
                 //保证最大堆的堆顶,小于最小堆
                 if(max.size() > 0 && max.peek() > num){
                     max.offer(min.poll());
                 }
                 else{
                     max.offer(min.poll());
                     //此处判断则可以省略
                 }
                 */
                 max.offer(min.poll());
             }
             else{
                 max.offer(num);
                 /*
                 //保证最小堆的堆顶大于最大堆
                 if(min.size() > 0 && min.peek() < num){
                     min.offer(max.poll());
                 }
                 else{
                     min.offer(max.poll());
                  //同上
                 }
                 */
                 min.offer(max.poll());
      

保证了上述两个条件,那么最大堆中的元素均小于最小堆,所以最大堆的堆顶元素与最小堆的堆顶元素为该序列的中位数。

class MedianFinder {
    private PriorityQueue<Integer> max;
    private PriorityQueue<Integer> min;
    /** initialize your data structure here. */
    public MedianFinder() {
        min = new PriorityQueue<>((x,y)->(x-y));
        max = new PriorityQueue<>((x,y)->(y-x));
    }
    
    public void addNum(int num) {
       if(min.size() == max.size()){
           min.offer(num);
           /*
           //保证最大堆的堆顶,小于最小堆
           if(max.size() > 0 && max.peek() > num){
               max.offer(min.poll());
           }
           else{
               max.offer(min.poll());
               //此处判断则可以省略
           }
           */
           max.offer(min.poll());
       }
       else{
           max.offer(num);
           /*
           //保证最小堆的堆顶大于最大堆
           if(min.size() > 0 && min.peek() < num){
               min.offer(max.poll());
           }
           else{
               min.offer(max.poll());
            //同上
           }
           */
           min.offer(max.poll());
       }
    }
    
    public double findMedian() {
        if(max.size() == min.size())
        return ((double)max.peek()+(double)min.peek())/2;
        return (double)max.peek();
    }
}

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder obj = new MedianFinder();
 * obj.addNum(num);
 * double param_2 = obj.findMedian();
 */

成功通过。

image-20210827204859686


2021.8.27
要找出数据流中位数,可以使用两个优先队列(堆)来实现。一个小顶堆存储较大的一半数据,一个大顶堆存储较小的一半数据。 具体步骤如下: 1. 初始化两个堆,一个小顶堆 `minHeap` 和一个大顶堆 `maxHeap`。 2. 遍历数据流中的每个元素: - 如果 `minHeap` 和 `maxHeap` 的大小相等,将元素插入到 `maxHeap` 中。 - 如果 `minHeap` 的大小大于 `maxHeap`,将元素插入到 `minHeap` 中。 - 如果插入元素后,`minHeap` 的堆顶元素大于 `maxHeap` 的堆顶元素,则交换两个堆顶元素。 3. 如果两个堆的大小之和是偶数,中位数就是两个堆顶元素的平均值;如果是奇数,中位数就是 `minHeap` 的堆顶元素。 下面是使用 C++ 实现的代码示例: ```cpp #include <iostream> #include <queue> #include <vector> class MedianFinder { public: void addNum(int num) { if (minHeap.empty() || num > minHeap.top()) { minHeap.push(num); } else { maxHeap.push(num); } if (minHeap.size() > maxHeap.size() + 1) { maxHeap.push(minHeap.top()); minHeap.pop(); } else if (maxHeap.size() > minHeap.size()) { minHeap.push(maxHeap.top()); maxHeap.pop(); } } double findMedian() { if (minHeap.size() == maxHeap.size()) { return (minHeap.top() + maxHeap.top()) / 2.0; } else { return minHeap.top(); } } private: std::priority_queue<int, std::vector<int>, std::greater<int>> minHeap; std::priority_queue<int, std::vector<int>, std::less<int>> maxHeap; }; int main() { MedianFinder finder; finder.addNum(1); finder.addNum(2); std::cout << finder.findMedian() << std::endl; // 输出 1.5 finder.addNum(3); std::cout << finder.findMedian() << std::endl; // 输出 2 return 0; } ``` 这段代码创建了一个 `MedianFinder` 类,通过 `addNum` 方法添加数据,然后通过 `findMedian` 方法获取中位数。在示例中,数据流为 1、2、3,所以中位数依次为 1.5 和 2。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值