算法学习(一):寻找最小的k个数

这篇博客探讨了寻找最小k个数的不同算法,包括排序、选择排序、最大堆、快速选择、线性时间排序和最小堆排序。强调了在处理海量数据时,最大堆的效率以及快速选择和最小堆的平均时间复杂度。还提到了线性时间的计数排序,但因其限制较多而不常用。
摘要由CSDN通过智能技术生成

题目

题目描述:寻找最小的k个元素
题目:输入n个整数,输出其中最小的k个
例如输入1,2,3,4,5,6,7,8,则最小的4个数是1,2,3,4

思路

,最容易想到的就是排序,然后输出前k个元素,快速排序,排序时间是n*logn,再加上遍历输出前k个元素,总的时间复杂度是n*logn+k = O(n*logn)
,其实题目中只要求输出前k个数,没有要求这些数是有顺序的,而且不必对n个数进行排序。从n个数中先取出前k个数放到一个数组中,然后对这k个数使用选择排序或者交换排序,找到kmax这k个数中最大的数,用时O(k)。然后从剩下的n-k个数中依次取出一个数x,与kmax比较,if x > kmax, 跳过,if x < kmax ,kmax= x,然后再对这k个数进行选择排序找到最大的kmax,总的时间复杂度平均下来为n*O(k),利用的就是要找的是最小的前k个数,如果比最大的大,肯定不在里面,如果比最大的小,可能在里面,因为有新的元素加入,再次进行排序找最大,又重复比较。
,我们可以对思路二中的k个数的操作进行改进,就是找到k个数中的kmax,可以使用最大堆,维护k个元素的最大堆,建堆耗时O(k),此时堆顶的根节点是最大的kmax,然后遍历剩下的n-k个元素,if x>kmax ,跳过,if x < kmax ,kmax = x,更新最大堆,时间复杂度为O(logk),总的时间复杂度为O(n*logk)
,我们的目的就是找到最小的k个数,如果有一种方法正好把这k个数放到左边,右边的都是比它们大的,直接输出就好了,这个其实就是快速排序的思路。n个数存在数组S中,随机选取一个数X作为枢纽元素,将数组划分为Sa和Sb两个部分,Sa<=X <= Sb,如果要查找的个数k小于sizeof(Sa),就返回Sa中前k个元素,否则返回Sa中所有元素+Sb中小的k-sizeof(Sa)个元素。这个算法的关键就是这个枢纽元素的选择,随机选取枢纽元素,可以做到线性期望时间O(n)。我们通常所熟知的快速排序是以固定的第一个或者最后一个做为枢纽元,每次递归划分都是不均等的,最后的平均时间复杂度为O(n * logn),RANDOMIZED-SELECT(数据结构与算法分析-c语言描述P185)提出的对于选择的线性期望时间,与普通的快排不同的是,每次都是随机的,随机的方法有“中位数的中位数”,“五分化中项的中项”。
,可以使用线性时间排序,计数排序,时间复杂度达到O(n)
,既然是找最小的前k个数,我们可以使用最小堆,将n个元素所在数组,建立最小堆,用时O(n),从堆顶取k次数,取完一次就要重新排列最小堆,保证最小堆的性质,每次平均用时logn,,总的时间复杂度为O(n+k*logn),这种方法与二比较,时间复杂度小,但是空间复杂度为O(n),最大堆的空间复杂度为O(k)
,思路和六是一样的,只不过是在取完堆顶元素后,重新排列时,换到堆顶的元素只需要下移最多k次就足够了,此时堆顶的元素已经是我们要找的第二小的元素,然后取出第二小的元素,再次把堆中的最后一个元素送到堆顶,又经过k-1次下移后,此后下移次数逐渐减少,重复k-1次,不断取出的堆顶元素是我们要找的最小的k个数,不过需要注意,算法中断后的堆已经不再是最小堆了,思路六中每次提取都要logn,这个需要k,总的时间复杂度为O(n+k^2)

实现

代码都是通过编译调试的,记录下来方便以后再回过头来复习,不过感觉还是写的比较low。加油吧。
思路一:快速排序

/*************************************************************************
    > File Name: quicksort_kmin.cpp
    > Author: zxl
  > mail: 857317335@qq.com
    > Created Time: 2016年04月07日 星期四 21时01分26秒
 ************************************************************************/

#include <iostream>
#define MAX 20000
#define K 100
using namespace std;
int partion(int A[],int start,int end)
{
    int x = A[end];
    int i = start-1;
    int j;
    for(j = start;j<end;j++)
    {
        if(A[j] <= x)
        {
            i++;
            swap(A[i],A[j]);

        }

    }
    swap(A[i+1],A[end]);
    return i+1;

}
void quicksort(int A[],int start,int end)
{
    if(start < end)
    {
        int mid = partion(A,start,end);
        quicksort(A,start,mid-1);
        quicksort(A,mid+1,end);
    }
}
void Kmin(int A[],int length,int k)
{
    int i;
    quicksort(A,0,length);
    for(i = 0;i<k;i++)
    {
        cout << A[i] << endl;
    }

}
int main()
{
    int A[MAX];
    int i;
    for(i = 0;i< MAX;i++)
        A[i] = MAX-i;
    Kmin(A,MAX-1,K);
    return 0;
}

思路二:

/************************************************************
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值