63、数据流中的中位数 值得再看
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
1、自己的想法与做法
class Solution {
public:
void Insert(int num)
{
result.push_back(num);
}
double GetMedian()
{
sort(result.begin(), result.end());
int len = result.size();
if (len % 2 == 0)
return (result[len / 2] + result[-1 + len / 2]) / 2.0//注意这里是2.0 这样才能返回值为double
else
return result[len / 2];
}
vector<int> result;
};
2、借助两个堆,非常精妙的方法
这里讨论两种方法:
一:代码复杂:减少不必要插入,提高效率
二:代码大大简化:可能有不必要插入,效率有所降低
==============思路解析=================================
思考:如何得到一个数据流中的中位数?
如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。
如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
一:代码复杂:
* 分析:对于海量数据和流的数据,用最大堆和最小堆来管理
* 我们希望 数据分为[小]|[大]两个部分,细化一点
[最大堆 | 左边最大 leftMax]
右边最小rightMin | 最小堆]
* 定义一个规则:保证左边和右边个数相差不大于1,且左边小于右边
* 1.数据是偶数的时候 insert的数据进入 [右边,最小堆]中
* 1.1当插入的数字cur > leftMax时,直接插入到[右边,最小堆]中
* 1.2当插入的数字cur < leftMax时,为了保证左边小于右边,
* 先把cur插入[最大堆|左边最大leftMax]中,
* 然后把leftMax放入[右边最小rightMin|最小堆]中
* 就可以保证: 左边 < 右边
* 2.数据是奇数的时候 insert的数据进入 [左边,最大堆]中
* 2.1当插入的数字cur < rightMin时,直接插入到[左边,最小堆]中
* 2.2当插入的数字cur > rightMin时,为了保证左边小于右边,
* 先把cur插入[右边最小rightMin|最小堆]中,
* 然后把rightMin放入[最大堆|左边最大leftMax]中
* 就可以保证: 左边 < 右边
* 最后:
* 如果是偶数:中位数mid= (leftMax+right)/2
* 如果是奇数:中位数mid= leftMax 因为先插入到左边,再插入到右边,为奇数时,中位数就是mid
class Solution {
public:
void Insert(int num)
{
count += 1; //数据是奇数的时候 insert的数据进入 [左边,最大堆]中
if (count % 2 == 1)//奇数
{
if (big_heap.empty()) big_heap.push(num); //直接插入到[左边,最小堆]中
else {
int rightMin = small_heap.top();
if (num <= rightMin) big_heap.push(num);
else {
small_heap.push(num); //先把cur插入[右边最小rightMin|最小堆]中
big_heap.push(rightMin); //然后把rightMin放入[最大堆|左边最大leftMax]中
small_heap.pop();
}
}
}
else {
if (small_heap.empty()) { //当第一个元素 比 第二个元素大的时候,会造成左边比右边大的情形,因此要加上判断
//当第一个数据比第二个大的时候,比如[5,2,3,4,1,6,7,0,8]的情况,会造成最大堆的唯一数据,比最小堆的唯一数据大的情况,这跟思想就不同了,因此需要加上一层判断。
if (num > big_heap.top())
{
small_heap.push(num);
}
else
{
small_heap.push(big_heap.top());
big_heap.pop();
big_heap.push(num);
}
}
else {
int leftMax = big_heap.top();
if (num >= leftMax) small_heap.push(num);//直接插入到[右边,最小堆]中
else {
big_heap.push(num);//先把cur插入[右边最小rightMin|最小堆]中,
small_heap.push(big_heap.top()); //然后把rightMin放入[最大堆|左边最大leftMax]中
big_heap.pop();
}
}
}
}
double GetMedian()
{
if (count & 0x1) {//看见这个0x你肯定知道这就是16进制表示了,而0x1就是最后一位肯定是1。偶数的二进制表示中最后一位肯定是0,
//如果是奇数那肯定是1,所以一个整数与0x1做按位与运算得到的结果是0或者1就可以判断出这个整数是偶数还是奇数。
return big_heap.top();
}
else {
return double((small_heap.top() + big_heap.top()) / 2.0);
}
}
private:
int count = 0;
priority_queue<int, vector<int>, less<int>> big_heap; // 左边一个大顶堆
priority_queue<int, vector<int>, greater<int>> small_heap; // 右边一个小顶堆
};
3、将上述代码简化版
取消了判断过程,直接插入到对面的堆中,然后再转移到自己的堆中
* 但是!!!时间复杂度提高,每次都插入时间复杂度O(log n)这是很可怕的
* 定义一个规则:不要判断了,保证小顶堆中最小的数也大于大顶堆中的数据
* 1.数据是偶数的时候 insert的数据进入 [右边,最小堆]中
* 先把cur插入[最大堆|左边最大leftMax]中,
* 然后把leftMax放入[右边最小rightMin|最小堆]中
* 就可以保证: 左边 < 右边
* 2.数据是奇数的时候 insert的数据进入 [左边,最大堆]中
* 先把cur插入[右边最小rightMin|最小堆]中,
* 然后把rightMin放入[最大堆|左边最大leftMax]中
* 就可以保证: 左边 < 右边
* 最后:
* 如果是偶数:中位数mid= (leftMax+right)/2
* 如果是奇数:中位数mid= leftMax
class Solution {
public:
void Insert(int num)
{
count += 1;
// 元素个数是偶数时,将大顶堆堆顶放入小顶堆
if (count % 2 == 0) {
big_heap.push(num);
small_heap.push(big_heap.top());
big_heap.pop();
}
else {
small_heap.push(num);
big_heap.push(small_heap.top());
small_heap.pop();
}
}
double GetMedian()
{
if (count & 0x1) {//看见这个0x你肯定知道这就是16进制表示了,而0x1就是最后一位肯定是1。偶数的二进制表示中最后一位肯定是0,
//如果是奇数那肯定是1,所以一个整数与0x1做按位与运算得到的结果是0或者1就可以判断出这个整数是偶数还是奇数。那就返回左边大顶堆得最小值即可
return big_heap.top();
}
else {
return double((small_heap.top() + big_heap.top()) / 2.0);
}
}
private:
int count = 0;
priority_queue<int, vector<int>, less<int>> big_heap; // 左边一个大顶堆
priority_queue<int, vector<int>, greater<int>> small_heap; // 右边一个小顶堆
// 大顶堆所有元素均小于等于小顶堆的所有元素.
};
二刷:
1、很经典的大小堆方法
运行时间:3ms 占用内存:484k
class Solution {
private:
int count = 0;
priority_queue<int,vector<int>,less<int>> left_big;
priority_queue<int,vector<int>,greater<int>> right_small;
public:
void Insert(int num)
{
count++;
if(count%2 == 1){ //奇数
right_small.push(num);
left_big.push(right_small.top());
right_small.pop();
}else{
left_big.push(num);
right_small.push(left_big.top());
left_big.pop();
}
}
double GetMedian()
{
if(count %2 == 1) return left_big.top();
else{
return double((left_big.top() + right_small.top())/2.0);
}
}
};
剑指 Offer 41. 数据流中的中位数
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例 1:
输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:
输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
执行用时:292 ms, 在所有 C++ 提交中击败了62.18%的用户
内存消耗:41.9 MB, 在所有 C++ 提交中击败了25.00%的用户
class MedianFinder {
public:
/** initialize your data structure here. */
MedianFinder() {
this->count = 0;
}
void addNum(int num) {
count++;
if(count %2 == 1){//奇数
right_small.push(num);
left_big.push(right_small.top());
right_small.pop();
}else{
left_big.push(num);
right_small.push(left_big.top());
left_big.pop();
}
}
double findMedian() {
if(count%2 == 1){//输入总数据为奇数,则在左边大顶堆中
return double(left_big.top());
}else{
return double( (left_big.top()+right_small.top())/2.0);
}
}
private:
int count;
priority_queue<int,vector<int>,less<int>> left_big;
priority_queue<int,vector<int>,greater<int>> right_small;
};
美女帅哥们如果觉得写的还行,有点用的话麻烦点个赞或者留个言支持一下阿秀~
如果觉得狗屁不通,直接留言开喷就完事了。