剑指offer之数据流中的中位数(数组、排序、堆)

目录

问题描述:

解法1:无序数组+集合自带的排序方法

Collections类

解法2 堆

堆的相关知识

1、定义

堆属性

完全二叉树

思路

优先队列(默认小最小堆)

如何确定升序还是降序

代码



问题描述:

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

解法1:无序数组+集合自带的排序方法

采用无序数组进行插入存储,然后利用集合自带的排序方法进行排序,最后求得结果。

import java.util.*;
public class Solution {
    ArrayList <Integer> data = new ArrayList<>();
    public void Insert(Integer num) {
    data.add(num);
    }

    public Double GetMedian() {
        Collections.sort(data);//Collections类中的sort方法可以对实现了List接口的集合进行排序
        int size = data.size();
        if (size%2!=0){
            return (double) data.get(size/2);
        }
        return ((double)data.get(size/2)+(double)(data.get(size /2 -1)))/2;
    }
}

Collections类

Collections提供以下方法对List进行排序操作

void reverse(List list):反转

void shuffle(List list),随机排序

void sort(List list),按自然排序的升序排序

void sort(List list, Comparator c);定制排序,由Comparator控制排序逻辑

void swap(List list, int i , int j),交换两个索引位置的元素

void rotate(List list, int distance),旋转。当distance为正数时,将list后distance个元素整体移到前面。当distance为负数时,将 list的前distance个元素整体移到后面。

解法2 堆

堆的相关知识

1、定义

堆(heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质:

  • 堆中某个结点的值总是不大于或不小于其父结点的值;

  • 堆总是一棵完全二叉树。

将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆是非线性数据结构,相当于一维数组,有两个直接后继。

堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。

最大堆:堆顶元素为序列中的最大值;

最小堆:堆顶元素为序列中的最小值;

堆属性

源自“唐先僧”(堆的操作同该链接)

堆分为两种:最大堆最小堆,两者的差别在于节点的排序方式。

在最大堆中,父节点的值比每一个子节点的值都要大。在最小堆中,父节点的值比每一个子节点的值都要小。这就是所谓的“堆属性”,并且这个属性对堆中的每一个节点都成立。



作者:唐先僧
链接:https://www.jianshu.com/p/6b526aa481b1
来源:简书

完全二叉树

思路

将数据分为相等的两部分(总数为奇数时相差1,最小堆数量多1),其中较小的部分用最大堆存储,较大的部分用最小堆存储。因此完整的排序顺序(从小到大)就是最大堆中的排序顺序+最小堆中的排序顺序。

因此,当总数为偶数时,中位数就是最大堆的堆顶元素和最小堆的堆顶元素的平均值;当总数为奇数时,中位数就是最小堆的堆顶元素。

如何保证数据插入正确的堆:

当已进入堆的数据总数为偶数时(包括0),新进来的数据应插入最小堆。由于新进来的数据未必大于最大堆中的所有数据,因此,将该数据插入最大堆,完成最大堆中的堆排序后将最大堆中的所有数据(包括新进来的数据)的最大值,插入到最小堆,然后完成最小堆的堆排序;

当已进入堆的数据总数为奇数时,由于最小堆中数据量更多,此时应插入到最大堆中。同理,由于新进来的数据未必小于最小堆中的所有数据,因此,将该数据插入最小堆,完成最小堆中的堆排序后将最小堆中的最小值(包括新进来的数据)插入到最大堆中,完成最大堆中的堆排序。

优先队列(默认小最小堆)

优先队列(priority queue)中的元素可以按照任意的顺序插入,但会按照有序的顺序进行检索。也就是说,无论何时调用remove方法,总会得到当前优先队列中最小的元素,但优先队列并没有对所有的元素进行排序,采用最小堆的数据结构。

如何确定升序还是降序

查源码可知,在调用compare时,当方法的返回值大于0时,就将数组的前一个数和后一个数做交换,其余情况位置不变,因此,

1、返回o1-o2

当o1 >o2时,返回值大于0,发送交换,

当o1 <o2时,返回值小于0,位置不变

因此,当返回o1-o2时为升序排列。

2、返回o2-o1

当o1 >o2时,返回值小于0,位置不变,

当o1 <o2时,返回值大于0,发生交换,

因此,当返回o2-o1时为降序排列。

 

代码

由于优先队列默认最小堆,故需重新compare方法改为最大堆;

import java.util.PriorityQueue;
import java.util.Comparator;

public class Solution {
    PriorityQueue<Integer> minHeap = new PriorityQueue<>(); //小顶堆
    PriorityQueue<Integer> maxHeap = new PriorityQueue<>(new Comparator<Integer>(){
        //大顶堆
        @Override
        public int compare(Integer i1,Integer i2){
            return i2-i1;//降序排列,小顶堆中是i1-i2
        }
    });
//Lambda表达式写法:
//PriorityQueue<Integer> Heap=new PriorityQueue<>((Comparator<Integer>)(o1,o2)->o2-o1);

    int count = 0;//记录当前个数是奇数还是偶数
    public void Insert(Integer num) {
        //个数为偶数的话,则先插入到大顶堆,并调整,然后将大顶堆中最大的数插入小顶堆中
        if(count % 2 == 0){
            maxHeap.offer(num);
            int max = maxHeap.poll();
            minHeap.offer(max);
        }else{
            //个数为奇数的话,则先插入到小顶堆,然后将小顶堆中最小的数插入大顶堆中
            minHeap.offer(num);
            int min = minHeap.remove();
            maxHeap.offer(min);
        }
        count++;
    }

    public Double GetMedian() {
        //当前为偶数个,则取小顶堆和大顶堆的堆顶元素求平均
        if(count % 2 == 0){
            return new Double(minHeap.peek() + maxHeap.peek())/2;
        }else{
            //当前为奇数个,则直接从小顶堆中取元素即可,所以我们要保证小顶堆中的元素的个数。
            return ((double)minHeap.peek());
        }
    }
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值