10亿数据找出前100大的数据(网易大数据面试算法题)

精华在评论区。。。。

当时去面试的时候现场现写,憋了将近一个小时,用递归实现了,估计问题很多,不是人家怎么可能不要我,哈哈哈,开个玩笑;

思路就是新建一个长度为100数组array1,把前100个元素放进去,排个序,然后再把剩下的元素拿来跟array1里面的元素比较,大于的时候替换,等于的时候就跳出循环取下一个元素,遍历一遍大数组就能取出前100大的数来,没考虑到时间复杂度,心里想实现了就烧高香了,那还管得了那么多。

后来回来百度的时候才发现,有更简洁的办法 ,利用堆排实现

什么是堆排?具体请见下面大神的博客

传送门:数据结构——常见的十种排序算法

利用堆排实现
1.取前n个数,建立一个小根堆。建堆的时间复杂度为O(nlogn)
2.顺序读取后边的元素,如果该元素比堆顶的元素小,直接丢弃。如果大于堆顶的元素则替换它,然后调整堆,最坏的情况是每一次都需要调整堆。时间复杂度为O(mlogn)。m为数据总数,n表示前n大的数。

代码实现:

import java.util.Arrays;

/**
 * @auther: shy
 * @date: 2020/5/13 9:50
 */
public class TopN {
    /**
     * 找出数组arr中最大的前n个值,不要求这n个值有序
     */
    public static int[] topN(int[] arr, int n) {
        /**
         * 构建堆积
         */
        int[] list = new int[n];

        // 在堆顶的始终是最小的值
        for (int i = 0; i < n; i++) {
            int t = i;
            while (t != 0 && list[parent(t)] > list[t]) {
                swap(list, t, t = parent(t));
            }
        }
        /**
         * 小顶堆
         */
        for (int i = n, len = arr.length; i < len; i++) {
            if (arr[i] >= list[0]) {
                // 置换栈顶
                list[0] = arr[i];
                // 调整栈顶
                int t = 0;
                // left(t) < n 防止下标越界
                while ((left(t) < n && list[t] > list[left(t)]) || (right(t) < n && list[t] > list[right(t)])) {
                    // 比较右节点和左节点值值,把小的节点值和父节点值对调
                    if (right(t) < n && list[right(t)] < list[left(t)]) {
                        swap(list, t, t = right(t));
                    } else {
                        swap(list, t, t = left(t));
                    }
                }
            }
        }
        return list;
    }
    private static void swap(int[] list, int i, int j) {
        int tmp = list[i];
        list[i] = list[j];
        list[j] = tmp;
    }
    /**
     * 父节点索引
     */
    private static int parent(int i) {
        return (i - 1) / 2;
    }
    /**
     * 左孩子索引
     */
    private static int left(int i) {
        return 2 * i + 1;
    }

    /**
     * 右孩子索引
     */
    private static int right(int i) {
        return 2 * i + 2;
    }
    public static void main(String[] args) {
        int[] arr = new int[] { 1, 2,90,47, 23, 4, 5, 11,97,1009, 12, 13,66 ,100 ,87};
        System.out.println(Arrays.toString(TopN.topN(arr, 4)));
    }
}

代码并非本人所写,来自大佬的博客,大佬写的很好帖出来一起学习,地址不小心走丢。。。。。。。。。。。。。。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值