剑指offer-最小的k个数

题目描述

输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。

解法一:
O(n)的算法,只有当我们可以修改输入的数组时可用
从上一题中我们可以得到启发,我们同样可以基于Partition函数来解决这个问题。如果基于数组的第k个数字来调整,使得比第k个数字小的所有数字都位于数组的左边,比第k个数字大的所有数字都位于数组的右边。这样调整之后,位于数组中左边的k个数字就是最小的k个数字。

package demo1;

import java.util.ArrayList;
import org.junit.Test;

public class Solution {
    public ArrayList<Integer> GetLeastNumbers_Solution(int[] input, int k) {
        ArrayList<Integer> output = new ArrayList<>();

        if (input == null || input.length <= 0 ||  k > input.length || k <= 0) {
            return output;
        }

        int start = 0;
        int end = input.length - 1;
        int mid = Partition(input, start, end);

        // 原理类似于二分法查找,只是此处运用了快速排序
        while (k != mid + 1) {
            if (k < mid + 1) {
                end = mid - 1;
                mid = Partition(input, start, end);
            } else {
                start = mid + 1;
                mid = Partition(input, start, end);
            }
        }

        for (int i = 0; i < k; i++) {
            output.add(input[i]);
        }
        return output;
    }

    // 快速排序,以data[0]为中心,运用快速排序,将数组元素分为左右两部分;左边小于data[0],右边大于data[0];
    private static int Partition(int[] data, int left, int right) {
        int temp = data[left];
        if (left > right) {
            return -1;
        }

        // 循环移动
        while (left < right) {
            // 1.右边向左移动
            while (left < right && temp <= data[right]) {
                right--;
            }
            data[left] = data[right];

            // 2.左边向右移动
            while (left < right && temp > data[left]) {
                left++;
            }
            data[right] = data[left];
        }

        data[left] = temp;  // 由于上面的步骤没有改变中心元素的值;这一步,将中心元素设置为data[0]
        return left;
    }

    @Test
    public void test() {
        int[] input = {4,5,1,6,2,7,3,8};
        System.out.println(GetLeastNumbers_Solution(input, 6));
    }
}

解法二:
O(nlogk)的算法,特别适用处理海量数据
我们可以先创建一个大小为k的数据容器来存储最小的k个数字,接下来我们每次从输入的n个整数中读入一个数。如果容器中已有数字少于k个,则直接把这次读入的整数放入容器中;如果容器中已有k个数字了,也就是容器已满,此时我们不能再插入新的数字了而只能替换已有的数字。找出这已有的k个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最小值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还大,那么这个数不可能是最小的k个整数之一,于是我们可以抛弃这个整数。
因此当容器满了之后,我们要做3件事;一是在k个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能要插入一个新的数字。如果用一个二叉树来实现这个容器,那么我们能在O(logk)时间内实现这三步操作。因此对于n个输入的数字而言,总的时间效率是O(nlogk).
我们可以选择用不同的二叉树来实现这个数据容器。由于每次都需要找到k个整数中的最大数字,我们很容易想到用最大堆。在最大堆中,根节点的值总是大于它的子树中的任意结点的值。于是我们每次可以在O(1)得到已有的k个数字中的最大值,但需要O(logk)时间完成删除及插入操作。

参考链接http://blog.csdn.net/jsqfengbao/article/details/47361471

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值