一、题目描述
中位数是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。
例如 arr = [2,3,4] 的中位数是 3 。
例如 arr = [2,3] 的中位数是 (2 + 3) / 2 = 2.5 。
实现 MedianFinder 类:
MedianFinder() 初始化 MedianFinder 对象。
void addNum(int num) 将数据流中的整数 num 添加到数据结构中。
double findMedian() 返回到目前为止所有元素的中位数。与实际答案相差 10-5 以内的答案将被接受。
示例 1:
输入
[“MedianFinder”, “addNum”, “addNum”, “findMedian”, “addNum”, “findMedian”]
[[], [1], [2], [], [3], []]
输出
[null, null, null, 1.5, null, 2.0]
解释
MedianFinder medianFinder = new MedianFinder();
medianFinder.addNum(1); // arr = [1]
medianFinder.addNum(2); // arr = [1, 2]
medianFinder.findMedian(); // 返回 1.5 ((1 + 2) / 2)
medianFinder.addNum(3); // arr[1, 2, 3]
medianFinder.findMedian(); // return 2.0
二、代码思路
首先,分析一下题目。题目要求是找中位数,中位数就是排序好的数组的中间位置,所以从这个角度来讲,可以有一种简单暴力的解法:
维护一个数组即可,然后每次添加元素对数组进行一次快排,最后根据数组的长度是偶数还是奇数找到中位数。
其次,我们从另一个角度来想,数据流会不断变化,需要有一个结构能够实时调整、存储数据流,而且还能支持动态调整维护结构的有序性,保证能够根据有序性找到中位数。
我们可以从以下考虑:
- TreeSet: 底层是红黑树(可以理解为平衡的二叉搜索树维护有序序列)
该数据结构顾名思义,底层是维护了一个红黑树来保证插入元素的有序性,可以自定义比较器;同时由于插入是有序的可以使用二分快速找到某一个元素;可以删除插入指定元素;缺点:没有索引,只能使用增强for和迭代器遍历。值和下标都在指定范围内 该题使用了TreeSet作为有序的滑动窗口 - 优先级队列: 底层是堆,分为大根堆小根堆,本质上是完全二叉树的顺序存储,其是为了找到极值而诞生的数据结构。要通过建堆和调整来维护堆的数据结构。
这里我认为TreeSet 和 priorityQueue都可以,TreeSet跟第一种方法了类似,重点介绍一下priorityQueue方法:
- 根据中位数分为左右两个堆,left 和 right。
- left是大根堆、right是小根堆。
- 插入元素时,如果元素数大于left堆最大元素,那么应该插入right。
- 插入元素时,如果元素数小于left堆最大元素,那么应该插入left。
- 同时在插入元素的时候,注意维护left 与 right 高度相差不超过1 。
- 保持left >= right,只是为了更好维持left 与 right高度。
- 堆顶元素即为中位数,区分奇数偶数。
三、代码思路
//维护两个优先级队列,分别存放中位数的左右两部分
PriorityQueue<Integer> queueLeft = new PriorityQueue<>((a, b) -> {return b - a;}); //大根堆
PriorityQueue<Integer> queueRight = new PriorityQueue<>((a, b) -> {return a - b;}); //小根堆
//初始化
public MedianFinder() {
}
//添加数
public void addNum(int num) {
//约定左队列数与右队列数量相同,或者左比右多一个
//所以,如果第一次添加先加入左队列
if (queueLeft.isEmpty()) {
queueLeft.offer(num);
return;
}
//1. 插入的数比左边的还小,那么加入左边
if (num <= queueLeft.peek()) {
queueLeft.offer(num);
//1.1 如果左边比右边多两个数,那么需要保持左右相差不超过1个
if (queueLeft.size() - queueRight.size() >= 2) {
queueRight.offer(queueLeft.poll());
}
} else {
//2. 插入的数比左边最大的还大,那么加入右边
queueRight.offer(num);
//2.1
if (queueRight.size() > queueLeft.size()) {
queueLeft.offer(queueRight.poll());
}
}
}
//获取数,需要考虑奇数偶数中位数不同的情况
public double findMedian() {
//如果两个队列元素相同(偶数)
if (queueLeft.size() == queueRight.size()) {
return (queueLeft.peek() + queueRight.peek()) / 2d;
} else {
return queueLeft.peek();
}
}