TOP-K问题

内容会持续更新,有错误的地方欢迎指正,谢谢!

在一堆数中求其第 k 大或第 k 小的问题,简称 TOP-K 问题。目前解决 TOP-K 问题最有效的算法即是 “BFPRT 算法”,最坏时间复杂度为 O(n)。

在首次接触 TOP-K 问题时,我们的第一反应就是可以先对所有数据进行一次排序,然后取其前 k 即可,但是这么做有两个问题:

  1. 快速排序的平均复杂度为 O(nlogn),但最坏时间复杂度为 O(n2),不能始终保证较好的复杂度。
  2. 我们只需要前 k 大的,而对其余不需要的数也进行了排序,浪费了大量排序时间。

BFPRT 算法的做法就是在快速排序的基础上,通过判断主元位置与 k 的大小使递归的规模变小,其次通过修改快速排序中主元的选取方法来降低快速排序在最坏情况下的时间复杂度。

求第K大问题的代码请见:http://blog.csdn.net/billcyj/article/details/79008724

相关习题
1、数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。例如输入一个长度为9的数组{1,2,3,2,2,2,5,4,2}。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。如果不存在则输出0。
2、春节期间小明使用微信收到很多个红包,非常开心。在查看领取红包记录时发现,某个红包金额出现的次数超过了红包总数的一半。请帮小明找到该红包金额。写出具体算法思路和代码实现,要求算法尽可能高效。
给定一个红包的金额数组gifts及它的大小n,请返回所求红包的金额。
测试样例:
[1,2,3,2,2],5
返回:2
经过分析不难看出,如果解决了Top K问题,上述两题就很容易解决了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BFPRT算法是一种解决Top-K问题算法,其中K为要找的第K大的元素。该算法的时间复杂度为O(n)。 BFPRT算法的基本思想是通过划分算法来找到中位数,然后根据中位数将数组分成两部分,只需要在一部分中查找Top-K,另一部分不用查找。 以下是BFPRT算法的c语言实现: ```c #include <stdio.h> #include <stdlib.h> #define SWAP(a, b) {int temp = a; a = b; b = temp;} // 求中位数 int median(int arr[], int left, int right) { int center = (left + right) / 2; if (arr[left] > arr[center]) SWAP(arr[left], arr[center]) if (arr[left] > arr[right]) SWAP(arr[left], arr[right]) if (arr[center] > arr[right]) SWAP(arr[center], arr[right]) SWAP(arr[center], arr[right - 1]) return arr[right - 1]; } // 划分函数 int partition(int arr[], int left, int right, int pivot) { int i, j; for (i = left, j = right - 2;;) { while (arr[++i] < pivot); while (arr[--j] > pivot); if (i < j) SWAP(arr[i], arr[j]) else break; } SWAP(arr[i], arr[right - 1]) return i; } // BFPRT算法 int bfprt(int arr[], int left, int right, int k) { if (left + 1 == right) return arr[left]; int pivot = median(arr, left, right); int mid = partition(arr, left, right, pivot); int num = mid - left + 1; if (k == num) return arr[mid]; else if (k < num) return bfprt(arr, left, mid, k); else return bfprt(arr, mid + 1, right, k - num); } int main() { int arr[] = {3, 4, 2, 1, 5, 6, 8, 7, 9}; int len = sizeof(arr) / sizeof(int); int k = 5; int kth = bfprt(arr, 0, len, k); printf("The %dth number is: %d\n", k, kth); return 0; } ``` 该算法的核心是BFPRT划分算法,该算法是一个递归算法,每次递归的时间复杂度为O(n),因此总的时间复杂度为O(nlogn)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值