题目要求:N个元素取出最大(小)的K个元素,请说明思路及算法。
注:每个方法都有其适用范围,比如有的在N数目很大的情况下适用。
方法一:首先对元素进行排序,然后去除最大的K个元素即可。可以用基本的直接插入排序、冒泡排序,也可以用快速排序和堆排序等方法来解决。一般来说都会要求快速排序,因为该方法综合来说是最好的。
快速排序版本1:该方法是算法导论上提出的,比较的思想是:从最开始的元素来与我们选定的元素(最右边元素)来比较,如果大于选定的元素,则不处理,如果小于选定的元素,就会往前替换。
快速排序版本2:一般的方法,从两边开始比较。
方法2:用一个最小堆来保存K个数,然后从第K+1个开始依次遍历数组,如果大于堆顶元素,则替换堆顶元素,重新调整堆。最后保留下的就是最大的K个元素。
方法3:利用hash保存数组中元素Si出现的次数,利用计数排序的思想,线性从大到小扫描过程中,前面k个数则为所求,平均情况下时间复杂度O(n)
方法4:编程之美上的思路
首先找到最大的第K个数。这个时间复杂度可以做到O(N),具体做法如下:
从N个数中随机选择一个
数,扫描一遍,比n大的放在右边,r个元素,比n小的放左边,l个元素
如果: a:l = K-1 返回n
b:l > K-1 在l个元素中继续执行前面的操作。
c:l < K-1 在r个元素中继续执行前面的操作。
b,c每次只需执行一项,因此平均复杂度大概为:O(n+n/2+n/4...)=O(2n)=O(n)