题目:求海量数据(正整数)按逆序排列的前k个数(topk),因为数据量太大,不能全部存储在内存中,只能一个一个的从磁盘或者网络上读取数据,请设计一个高效的算法来解决这个问题。
第一行:用户输入输入K,代表要求得topk
随后的N(不限制)行,每一行是一个整数代表用户输入的数据
用户输入-1,代表输入终止
请输出topk,从小到大,空格分隔。
题意理解:这道题意思就是这里有很多数,我们需要一个一个输进去,然后找到最大的前K个数,按从小到大的顺序输出。
解题思路:因为我们最后只需要输出k个数,所以我们只需要建立一个长度为k的数组,然后我们依次往里面存数,当没有空位的时候我们没次找到最小的数,把它给换掉,最后输入-1的时候就结束了,得到的这个乱序数组,排好序就是我们要的结果了。
这里找最小的数的方案有两种,第一种:(暴力)通过两层for循环找到最小的那个数。
第二种:(小顶堆)当数组中有K个元素后,我们就可以进行堆化了,然后当有数输入的时候,(小顶堆)这个数组的第一个元素就是最小的,如果输入的这个数更大就交换,然后再向下调整。
注意:对于大量的数据我们明显可以看出第二种的性能更好。
第二种方案的代码:
import java.util.Arrays;
import java.util.Scanner;
public class TOPK {
static int[] arr;
static int index = 0;
static int k;
public static void main(String[] args) {
// TODO Auto-generated method stub
Scanner sc = new Scanner(System.in);
k = sc.nextInt();
arr = new int[k];
int x = sc.nextInt();
while(x!=-1) {
deal(x);
x = sc.nextInt();
}
Arrays.sort(arr);//输入已经结束了,对结果进行处理,按从小到大的顺序输出
System.out.println(Arrays.toString(arr));
}
public static void deal(int x) {
if(index<k) {
arr[index] = x;//数据没有填满的情况下,往数组中填数据
index++;//移动指针
if(index == k) {//移动指针后发现数组越界了,说明此时数组已经填满了
//对这个数组进行堆化(小顶堆)
duihua(arr);
}
}else if(arr[0]<x) {//和堆顶进行比较,如果堆顶的更小,那么交换,然后向下调整
arr[0] = x;
adjust(arr,0);
}
}
public static void duihua(int[] arr) {
int endnode = arr.length/2-1;//最后一个非叶子节点
for(int i = endnode;i>=0;i--) {//从下往上,从右到左,开始堆化
adjust(arr,i);
}
}
public static void adjust(int[] arr,int i) {
int left,right;//左右孩子
left = 2*i+1;
right = 2*i+2;
int min =0;
int temp;
//说明该节点是叶子节点,left已经越界了
if(left>=arr.length) {
return;
}
//有左孩子,但是右孩子越界了不存在
else if(right>=arr.length) {
min = left;
}
//孩子节点中左孩子是最小的
else if(arr[left]>=arr[right]){
min = right;
}
else {
min = left;
}
//父节点小于孩子节点,不用调整。
if(arr[i]<=arr[min]) {
return;
}
else {
temp = arr[i];
arr[i] = arr[min];
arr[min] = temp;
adjust(arr,min);//父节点与孩子节点交换值过后需要向下调整,所以用递归。
}
}
}