11073 最热门的K个搜索串

题目描述

11073 最热门的K个搜索串
时间限制:600MS  代码长度限制:10KB
提交次数:0 通过次数:0

题型: 编程题   语言: G++;GCC;VC;JAVA
Description
大家都非常喜欢而习惯用baidu,google,sogou等搜索引擎来搜索自己感兴趣的资料。
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。
假设目前有一百万个记录(这些查询串的重复度比较高,除去重复后会少很多)。
搜索引擎统计查询串的重复频度,一个查询串的重复频度越高,说明查询它的用户越多,也就是越热门。
希望能找到最热门的10个或100个查询串。

现在问题模型是:一个无序的整数数列,数列元素个数为N,1000<=N<=1000000,
如何选出其中最大的K个数,K远小于N(K<<N, K<1000),
比如Top10的数,或Top100的数等。本意并不要求选出的这K个数有序,也不要求剩余的N-K个数有序。
但最终输出为便于评判,还是要求排序的,具体看如下说明(3)。

说明:
(1)虽然此题N较大,还是可以一次性将整数数列导入内存的。

(2)此题认为N较大,不适合对所有元素排序后取得“最大的K个数”,
此排序法复杂度O(NlogN),请你勿用此法,否则将判超时。请选用低于O(NlogN)阶的算法来做。

(3)此题原本是不要求选出的K个数有序,但为了在本OJ(Oline Judge)系统上便于评判,
还是请您以从大至小的不增顺序输出。



输入格式
输入:两行,第一行N和K,第二行为N个无序整数


输出格式
输出:这N个无序整数的最大的K个数


输入样例
20 6
9 1 2 5 3 2 3 4 10 7 1 5 7 6 4 8 9 6 7 5


输出样例
10 9 9 8 7 7


提示

这个问题就是在海量的N个数中求最大的K个数,K<<N。
上课时非常仔细讲解过这个问题,可以用多种方法来求解。
比较好的就是用(1)堆的方法,或(2)快速选择算法。


对算法(1):

1. 先建一个长度为K的最小堆,存储N个元素的前K个元素,并假设他们就是最大的K个数,建堆费时O(K)2. 弹堆顶x,将后续N-K个元素逐个遍历,和堆顶x比较,若比x大,插入并更新堆,若比x小,丢弃;
3. 后续N-K个遍历完后,这个最小堆中的所有元素就是前K大了。将堆顶逐个输出就达到题目的有序输出的要求了。
总耗时最坏:O(K+(N-K)logK) = O(NlogK),当K较小,接近线性效率,且堆的空间很小(只有K),非常适合于海量数据查询第K大元素(K<<N)。
此方法得益于在堆中,插入、查找等各项操作时间复杂度均为logK。即使是求第K小,前K小,第K大,前K大也都是同理的。


对算法(2):

采用快速选择算法,选支点元素时,用随机选择一个支点元素为宜(书上P27的算法),一般情况运行性能都很好。
倒是无须用“中位数的中位数”(P28的算法)做支点元素来完成,当然你想试试也不赖。
第K大元素找到后,做过Partition之后,第K大元素之后段(含第K大)的就是比第K大还大的前K大了。再对前K大排序输出即可。```

思路

  1. 用提示中的算法(2)但是用的是从大到小排序,快速选择第K大的数,也就是选择从大到小排序的第k个数。
  2. 选出之后数组中前k个数即所需要的前k大数。再对其排序即可。

代码

#include <iostream>

using namespace std;

const int N = 1000010;

int q[N];


//利用双指针 i和j同时往中间移动,保证i左边的数小于等于x,j右边的数大于等于x,找到不满足的情况暂停,然后左右i和j交换
//快速排序
void quickSort(int q[],int l,int r){
    if(l>=r) return;
    int x=q[l+r>>1],i=l-1,j=r+1; //l+r>>1取中间
    while (i<j)
    {
        do i++;while (q[i]>x);
        do j--;while (q[j]<x);
        if(i<j) swap(q[i],q[j]);
    }
    quickSort(q,l,j); //注意边界j和j+1或者i-1和i
    quickSort(q,j+1,r);
}


//快速选择
void quick_select(int q[], int l, int r, int k)
{
    if (l >= r) return ;

    int i = l - 1, j = r + 1, x = q[l + r >> 1];
    while (i < j)
    {
        do i ++ ; while (q[i] > x);
        do j -- ; while (q[j] < x);
        if (i < j) swap(q[i], q[j]);
    }

    if (j - l + 1 >= k)  quick_select(q, l, j, k);
    else  quick_select(q, j + 1, r, k - (j - l + 1));
}

int main()
{
    int n, k;
    scanf("%d%d", &n, &k);
    for (int i = 0; i < n; i ++ ) scanf("%d", &q[i]);

    quick_select(q, 0, n - 1, k);

    quickSort(q,0,k);

    for (int i = 0; i < k; i++)
    {
        cout<<q[i]<<" ";
    }
    
    return 0;
}

模板

贴两个y总给的模板

快速排序

题目

给定你一个长度为 n 的整数数列。

请你使用快速排序对这个数列按照从小到大进行排序。

并将排好序的数列按顺序输出。

代码


#include <iostream>
using namespace std;

const int N = 1e6+10;

int n;
int q[N];

//利用双指针 i和j同时往中间移动,保证i左边的数小于等于x,j右边的数大于等于x,找到不满足的情况暂停,然后左右i和j交换
void quickSort(int q[],int l,int r){
    if(l>=r) return;
    int x=q[l+r>>1],i=l-1,j=r+1; //l+r>>1
    while (i<j)
    {
        do i++;while (q[i]<x);
        do j--;while (q[j]>x);
        if(i<j) swap(q[i],q[j]);
    }
    quickSort(q,l,j); //注意边界j和j+1或者i-1和i
    quickSort(q,j+1,r);
}


int main(){
    scanf("%d",&n);
    for (int i = 0; i < n; i++)
    {
        scanf("%d",&q[i]);
    }
    quickSort(q,0,n-1);
    for (int i = 0; i < n; i++)
    {
        printf("%d ",q[i]);
    }
    
    return 0;
}

测试用例

输入样例:
5
3 1 2 4 5
输出样例:
1 2 3 4 5

快速选择

题目

给定一个长度为 n 的整数数列,以及一个整数 k,请用快速选择算法求出数列从小到大排序后的第 k 个数。

模板

#include <iostream>

using namespace std;

const int N = 1000010;

int q[N];

int quick_sort(int q[], int l, int r, int k)
{
    if (l >= r) return q[l];

    int i = l - 1, j = r + 1, x = q[l + r >> 1];
    while (i < j)
    {
        do i ++ ; while (q[i] < x);
        do j -- ; while (q[j] > x);
        if (i < j) swap(q[i], q[j]);
    }

    if (j - l + 1 >= k) return quick_sort(q, l, j, k);
    else return quick_sort(q, j + 1, r, k - (j - l + 1));
}

int main()
{
    int n, k;
    scanf("%d%d", &n, &k);

    for (int i = 0; i < n; i ++ ) scanf("%d", &q[i]);

    cout << quick_sort(q, 0, n - 1, k) << endl;

    return 0;
}

测试用例

输入样例:
5 3
2 4 1 5 3
输出样例:
3
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值