剑指offer 学习笔记 最小的k个数

面试题40:最小的k个数。输入n个数,找出其中最小的k个数。

最简单的方法就是排序数组,找出前k个数即可。这种思路时间复杂度为O(nlogn),太慢了。

法一:该方法时间复杂度为O(n)。此方法只有当我们可以修改输入数组时才能使用,基于快排的Partition函数,找到一轮排序后下标为k-1的数字,这个数组的前k项即为最小的k个数,但不一定是有序的:

#include <iostream>
using namespace std;

int Partition(int* nums, int length, int start, int end) {
    if (nums == nullptr || length <= 0 || end > length - 1 || start < 0) {
        return false;
    }

    int target = start + (rand() % (end - start + 1));    // 随机选择一个数字
    swap(nums[target], nums[end]);    // 将选中的数字与下标为end的数字交换

    int small = start - 1;
    int index = start;
    while (index < end) {
        if (nums[index] < nums[end]) {
            ++small;
            swap(nums[small], nums[index]);
        }
        ++index;
    }
    swap(nums[++small], nums[end]);
    return small;
}

void GetLeastNumbers(int* nums, int length, int k) {
    if (nums == nullptr || length <= 0 || k <= 0 || k > length - 1) {
        return;
    }

    int start = 0, end = length - 1, index = Partition(nums, length, start, end);
    while (index != k - 1) {
        if (index > k - 1) {
            end = index - 1;
            index = Partition(nums, length, start, end);
        } else {
            start = index + 1;
            index = Partition(nums, length, start, end);
        }
    }

    for (int i = 0; i < k; ++i) {
        cout << nums[i] << endl;
    }
}

int main() {
    int nums[] = { 5,7,9,8,4,6,3,2,1,0 };
    GetLeastNumbers(nums, sizeof(nums) / sizeof(*nums), 4);
}

法二:时间复杂度为O(nlogk),适合处理海量数据。可以创建一个大小为k的数据容器,接下来每次从输入的n个整数中读取一个数,如果容器中已有数字少于k个,则直接把该数放入容器中;如容器中已有k个数字,我们就只能替换已有的数字,找出这k个数字的最大值,然后拿这次待插入的整数和最大值进行比较,如果待插入的值比当前已有的最大值小,则用这个数替换最大值,否则抛弃待插入的数。

容器满了之后,我们要做三件事:
1.在k个整数中找到最大值。
2.可能删除最大值。
3.可能插入一个新的值。
如果我们用二叉树来实现该数据容器,那么我们能在O(logk)的时间内实现这三个操作,对于n个输入的数字而言,总的时间效率是O(nlogk)。

由于要找到k个整数中的最大数字,可以使用最大堆,这样我们可以在O(1)的时间内找到最大值,但需要O(logk)的时间完成删除和插入操作。

我们还可以使用红黑树实现容器,红黑树通过把结点分为红、黑两种颜色并根据一些规则保证树在一定程度上是平衡的,从而保证在红黑树中的查找、删除、插入操作都需要O(logk)的时间。STL中的set和multiset是基于红黑树实现的:

#include <iostream>
#include <set>
using namespace std;

typedef multiset<int> intSet;    // set中从小到大排列数据

void GetLeastNumbers(const vector<int>& data, int k, intSet& leastNumbers) {
    if (k < 1 || k > data.size()) {
        return;
    }

    leastNumbers.clear();

    vector<int>::const_iterator cb = data.cbegin(), ce = data.cend();
    for (; cb < ce; ++cb) {
        if (leastNumbers.size() < k) {
            leastNumbers.insert(*cb);
        } else {
            if (*cb < *(--leastNumbers.end())) {    // 如果当前输入值比数据容器中的最大值小,则将最大值替换为该当前值
                leastNumbers.erase(--leastNumbers.end());    // 删除最大值
                leastNumbers.insert(*cb);
            }
        }
    }
}

int main() {
    intSet leastNumbers;
    vector<int> data = { 0,5,8,9,3,7,4,5,6,1,3 };
    GetLeastNumbers(data, 3, leastNumbers);

    auto b = leastNumbers.begin(), e = leastNumbers.end();
    for (; b != e; ++b) {
        cout << *b << endl;
    }
}

两种解法比较:
在这里插入图片描述
第二个解法适合海量数据输入,当不能把全部数据都载入内存时,可以从硬盘中每次读取出一些数据,再判断这些数据是否需要放入容器leastNumbers中即可。适合n较大,k较小的问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值