【快速选择算法】数组分三段快排选择——TopK问题

在这里插入图片描述

1.前言

什么是TopK问题?
TopK问题指在一组数据中找出最大(或最小)的前K个数。
常见例子包括搜索引擎的前K个最相关结果推荐系统的前K个最感兴趣产品数据分析中的前K个高频元素等

常见的TopK问题的问法:

  • 找出前K个大的数 该问法需要返回数组
  • 找出第K个大的数 该问法需要返回一个数字

常见的解法:

  • 堆排序(更适合k值比较小的时候)
  • 快速选择排序(更适合k值比较大的时候)

拓展:堆排序与快速选择排序解决TopK问题的区别
TopK问题可以用快速选择排序解决,同时也可以使用堆排序解决。两种方法在解决TopK问题时各有特点。

快速选择排序解决TopK问题
快速选择排序是基于快速排序的划分思想,但不同于快速排序的递归排序整个数组,快速选择排序只关注包含所求元素的那一部分。具体来说,它通过一次划分将数组分为两部分,其中一部分的所有元素都比另一部分的所有元素小,然后判断第k小的元素位于哪一部分,并继续在该部分进行划分,直到找到第k小的元素为止。这种方法的时间复杂度平均情况下为O(n),但在最坏情况下会退化到O(n^2)。

堆排序解决TopK问题
堆排序解决TopK问题则是通过维护一个大小为K的堆(大顶堆或小顶堆),遍历数组中的每个元素,并与堆顶元素进行比较。如果当前元素满足成为TopK元素的条件(对于最大TopK,即大于堆顶元素;对于最小TopK,即小于堆顶元素),则将其与堆顶元素交换,并重新调整堆。这种方法的时间复杂度为O(nlogk),因为它需要对每个元素执行一次堆操作,而堆操作的时间复杂度为O(logk)。

两者的区别

  • 时间复杂度:
    快速选择排序在平均情况下时间复杂度为O(n),但在最坏情况下会退化到O(n^2)。
    堆排序解决TopK问题的时间复杂度稳定为O(nlogk)。
  • 空间复杂度:
    快速选择排序通常是原地排序,空间复杂度较低,为O(1)(不考虑递归栈空间)。
    堆排序需要额外空间来维护堆结构,空间复杂度为O(k)。
  • 稳定性
    快速选择排序是不稳定的排序算法,即相等的元素可能在排序后的序列中改变顺序。
    堆排序同样是不稳定的排序算法。
  • 适用场景
    快速选择排序在处理大数据集且k值相对较大时可能更有效率,特别是当数据分布较均匀时。
    堆排序则更适合处理TopK问题,特别是当k值较小时,因为它可以稳定地以O(nlogk)的时间复杂度找到答案。


    综上所述,快速选择排序和堆排序都是解决TopK问题的有效方法,但在具体应用中需要根据数据集的大小、k值的大小以及数据的分布特性来选择合适的方法。

2.题目简介

题目链接:LINK
在这里插入图片描述

3.求解思路

如何解决?可以用堆排序也可以用快速选择排序,在本题中我们使用快速选择排序
在这里插入图片描述

4.示例代码

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) 
    {
        //假设k>=nums.size()
        srand(time(nullptr));

        return qsort(nums, 0, nums.size() - 1, k);    
    }

    int qsort(vector<int>& nums, int begin, int end, int k)
    {
        if(begin == end) return nums[begin];

        //数组分三块
        int left = begin - 1, right = end + 1, i = begin;
        int key = GetRandom(nums, begin, end);
        while(i < right)
        {
            if(nums[i] < key)
            {
                swap(nums[i++], nums[++left]);
            }
            else if(nums[i] == key)
            {
                i++;
            }
            else//nums[i] > key
            {
                swap(nums[i], nums[--right]);
            }
        }

        //分情况讨论
        int c = end - right + 1;
        int b = (right - 1) - (left + 1) + 1;
        int a = end - begin + 1 - c - b;
        if(c >= k) return qsort(nums, right, end, k);
        else if(b + c >= k) return key;
        else return qsort(nums, begin, left, k - b - c);
    }

    int GetRandom(vector<int>& nums, int begin, int end)
    {
        int r = rand();

        return nums[(r % (end - begin + 1)) + begin];
    }
};

在这里插入图片描述


EOF

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值