【JZOJ 3870】 单词检索

Description

小可可是学校图书馆的管理员,现在他接手了一个十分棘手的任务。
由于学校需要一些材料,校长需要在文章中检索一些信息。校长一共给了小可可N篇文章,每篇文章为一个字符串。现在,校长需要他找到这样的单词,它至少在这N篇文章中的M篇文章里出现过,且单词长度为L。可是,工作量十分庞大,但校长又急需小可可完成这项任务。
现在他向你求助,需要你编写程序完成这项艰巨的任务。

对于100%的数据有1≤N,M≤2000,L≤1000。每篇文章长度不大于1000,均有小写字母组成。

Analysis

solution 1 字符串哈希

因为字符串长度为L不变,所以动态更新哈希值
记得要先模一个大一点的数,如果太小容易重复导致出错
记录哈希值的时候再模小一点的,这个可以小一点是因为只需存起来不需比较
为了更优美最好弄双哈希,我单哈希过掉了

solution 2 SA

——by chunkit lau
把所有串连起来,各个串中间用各不相同的特殊符号连起来
对于height,把>=L的分成一段,判断每一段内是否有多于m个出现在不同的串里

Code

#include<cstdio>
#include<cstring>
#include<algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
typedef long long ll;
const int N=2005;
const ll mo=1e9+7,hx=5000000;
int n,m,l,h[hx][3];
ll _26,a[N];
char s[N];
int hash(int x)
{
    int pos=x%hx;
    while(h[pos][0] && h[pos][0]!=x) pos=(pos+1)%hx;
    h[pos][0]=x;
    return pos;
}
int main()
{
    int _,ans=0;
    scanf("%d %d %d\n",&_,&m,&l);
    _26=1;
    fo(i,1,l) _26=_26*26%mo;
    while(_--)
    {
        scanf("%s\n",s+1);
        n=strlen(s+1);
        if(n<l) continue;
        fo(i,1,n)
        {
            a[i]=(a[i-1]*26+s[i]-'a'+1)%mo;
            if(i>=l)
            {
                if(i>l) a[i]=(a[i]-(s[i-l]-'a'+1)*_26%mo+mo)%mo;
                int pos=hash(a[i]);
                if(h[pos][2]==_) continue;
                if(++h[pos][1]==m) ans++;
                h[pos][2]=_;
            }
        }
    }
    printf("%d",ans);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值