题目要求:N个元素取出最大(小)的K个元素,请说明思路及算法。
注:每个方法都有其适用范围,比如有的在N数目很大的情况下适用。
方法一:首先对元素进行排序,然后去除最大的K个元素即可。可以用基本的直接插入排序、冒泡排序,也可以用快速排序和堆排序等方法来解决。一般来说都会要求快速排序,因为该方法综合来说是最好的。
快速排序版本1:该方法是算法导论上提出的,比较的思想是:从最开始的元素来与我们选定的元素(最右边元素)来比较,如果大于选定的元素,则不处理,如果小于选定的元素,就会往前替换。
- int Partition(int A[],int p,int r) //非递减排序方法
- {
- int x = A[r];
- int i = p-1,mid;
- for(int j=p;j<r;j++)
- {
- if(A[j] <= x) //寻找小于x的数据,找到以后会往前交换
- {
- i=i+1;
- if(i!=j) //不相等的才需要交换,算法导论上直接交换了,这里感觉可以优化
- {
- swap(&A[i],&A[j]);
- }
- }
- }
- swap(&A[i+1],&A[r]);
- return i+1;
- }
- void QuickSort(int A[],int p,int r)
- {
- int q;
- if(p<r)
- {
- q = Partition(A,p,r); //得到q以后递归调用
- QuickSort(A,p,q-1);
- QuickSort(A,q+1,r);
- }
- }
快速排序版本2:一般的方法,从两边开始比较。
- int Partition1(int a[],int low,int high)
- {
- int pivotkey;
- pivotkey = a[low]; //枢纽记录关键字
- while(low < high) //从表的两端交替地想中间扫描
- {
- while(low < high&& a[high] >=pivotkey)
- --high;
- a[low] = a[high]; //将比枢纽小的移到低位
- while(low<high&& a[low] <=pivotkey)
- ++low;
- a[high] = a[low]; //将比枢纽大的移到高位
- }
- a[high] = pivotkey; //枢纽记录到位
- return high; //返回枢纽位置
- }
- void QuickSort(int A[],int p,int r)
- {
- int q;
- if(p<r)
- {
- q = Partition1(A,p,r); //得到q以后递归调用
- QuickSort(A,p,q-1);
- QuickSort(A,q+1,r);
- }
- }
方法2:用一个最小堆来保存K个数,然后从第K+1个开始依次遍历数组,如果大于堆顶元素,则替换堆顶元素,重新调整堆。最后保留下的就是最大的K个元素。
方法3:利用hash保存数组中元素Si出现的次数,利用计数排序的思想,线性从大到小扫描过程中,前面k个数则为所求,平均情况下时间复杂度O(n)
方法4:编程之美上的思路
首先找到最大的第K个数。这个时间复杂度可以做到O(N),具体做法如下:
从N个数中随机选择一个数,扫描一遍,比n大的放在右边,r个元素,比n小的放左边,l个元素
如果: a:l = K-1 返回n
b:l > K-1 在l个元素中继续执行前面的操作。
c:l < K-1 在r个元素中继续执行前面的操作。
b,c每次只需执行一项,因此平均复杂度大概为:O(n+n/2+n/4...)=O(2n)=O(n)