UVA 10829 L-Gap Substrings(后缀数组+枚举区间优化)

题目大意:给定一个字符串,问有多少字符串满足UVU的形式,要求U非空,V的长度为g。

思路:首先,很容易想到用后缀数组求LCP,能够在O(1)的时间求任意2点的lcp。

一开始我想的是枚举v的起点,然后在v的左侧枚举左端u的起点,设左端u的起点为i,那么u_len等于v的起点减i,然后右端起点固定为j=i+u_len+v_len,那么只要lcp(i,j)为u_len,则ans++。  很可惜,这个思路时间复杂度为 O(N2).

然后我上网搜了题解,发现有一个枚举u_len的做法,能够将时间复杂度优化为O(nlogn).具体思路如下:

首先枚举U_len,然后字符串会被划分成len-u_len段,每段的起点为0,u_len,2*uLen....... 对于每个uvu串,其左端的u必定只覆盖一个起点,这样我们对于每个起点,计算左侧U覆盖该点的UVU串有多少个。

这样说可能还有点抽象,那么以下图为例,若我们要求串 aabaabaaaa ,设u_len枚举到了2,v_len=1,则串被划分为aa|ba|ab|aa|aa  

假设我们现在求左侧U覆盖第二个起点(即下标为2的点)的uvu串有几个 ,设该起点为i,则很容易求出,该串也必须覆盖点j=i+u_len+v_len。那么对i和j向右求LCP,向左求反向LCP。

为什么要这样做呢?因为我们要得到一个u的可行区间,在该区间内,左侧u和右侧u一定相等,且中间相隔v。而向右求lcp能求出区间右端点,向左求lcp能求出区间左端点。(认真思考)

但是左右端点到i的距离不能大于u_len,因为如果取了大于u_len的值,那么左侧u就会覆盖下一个分隔段的起点,会产生重复答案(认真思考)


(红色字符为分隔段首字符,括号内为经过第二个首字符(str[2])的左侧u的可取区间,因为u的长度枚举到了2,所以经过str[2]的u可以取str[1~2]和str[2~3],每对相同颜色的下划线代表左侧的u和同一个uvu串中右侧的u)

最后对于每个u_len的每个分隔段起点,ans+=区间长度-u_len+1。

下面附上ac代码:

#include<queue>
#include<cstring>
#include<string>
#include<iostream>
#include<cstdio>
#include<map>
using namespace std;
const int MAXN=100010;
int t1[MAXN],t2[MAXN],c[MAXN];//求SA数组需要的中间变量,不需要赋值
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中,sa数组下标范围1~n
bool cmp(int *r,int a,int b,int l) {
    return r[a] == r[b] && r[a+l] == r[b+l];
}
void da(int str[],int sa[],int rank1[],int height[],int n,int m) {   //n是串长度,m是字符集大小,一般128
    n++;
    int i, j, p, *x = t1, *y = t2;
    //第一轮基数排序,如果s的最大值很大,可改为快速排序
    for(i = 0; i < m; i++)c[i] = 0;
    for(i = 0; i < n; i++)c[x[i] = str[i]]++;
    for(i = 1; i < m; i++)c[i] += c[i-1];
    for(i = n-1; i >= 0; i--)sa[--c[x[i]]] = i;
    for(j = 1; j <= n; j <<= 1) {
        p = 0;
        //直接利用sa数组排序第二关键字
        for(i = n-j; i < n; i++)y[p++] = i;//后面的j个数第二关键字为空的最小
        for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;
        //这样数组y保存的就是按照第二关键字排序的结果
        //基数排序第一关键字
        for(i = 0; i < m; i++)c[i] = 0;
        for(i = 0; i < n; i++)c[x[y[i]]]++;
        for(i = 1; i < m; i++)c[i] += c[i-1];
        for(i = n-1; i >= 0; i--)sa[--c[x[y[i]]]] = y[i];
        //根据sa和x数组计算新的x数组
        swap(x,y);
        p = 1;
        x[sa[0]] = 0;
        for(i = 1; i < n; i++)
            x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p >= n)break;
        m = p;//下次基数排序的最大值
    }
    int k = 0;
    n--;
    for(i = 0; i <= n; i++)rank1[sa[i]] = i;
    for(i = 0; i < n; i++) {
        if(k)k--;
        j = sa[rank1[i]-1];
        while(str[i+k] == str[j+k])k++;
        height[rank1[i]] = k;
    }
}
int rank1[MAXN],height[MAXN];
int RMQ[MAXN];
int mm[MAXN];
int best[20][MAXN];
void initRMQ(int n) {     //调用da后,初始化RMQ(求LCP用)
    for(int i=1; i<=n; i++)RMQ[i]=height[i];
    mm[0]=-1;
    for(int i=1; i<=n; i++)
        mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
    for(int i=1; i<=n; i++)best[0][i]=i;
    for(int i=1; i<=mm[n]; i++)
        for(int j=1; j+(1<<i)-1<=n; j++) {
            int a=best[i-1][j];
            int b=best[i-1][j+(1<<(i-1))];
            if(RMQ[a]<RMQ[b])best[i][j]=a;
            else best[i][j]=b;
        }
}
int askRMQ(int a,int b) {
    int t;
    t=mm[b-a+1];
    b-=(1<<t)-1;
    a=best[t][a];
    b=best[t][b];
    return RMQ[a]<RMQ[b]?a:b;
}
int lcp(int a,int b) {
    a=rank1[a];
    b=rank1[b];
    if(a>b)swap(a,b);
    return height[askRMQ(a+1,b)];
}
char str[MAXN];
int r[MAXN];  //把字符串存到这个数组里
int sa[MAXN];   //后缀数组
int n;
int main() {
    //freopen("in.txt","r",stdin);
    int t,now=0;
    cin>>t;
    while(t--) {
        int gn;
        scanf("%d%s",&gn,str);
        n=strlen(str);
        for(int i=0; i<n; i++) {
            r[2*n-i]=r[i]=str[i]-'a'+1;
        }
        r[n]=29;
        int len=2*n+1;
        r[len]=0;
        da(r,sa,rank1,height,len,30);
        initRMQ(len);
        long long ans=0;
        int r;
        for(int U=1;2*U+gn<=n;U++){
            for(int l=0;(r=l+U+gn)<n;l+=U){
                 int width=min(U,lcp(l,r))+min(U,lcp(2*n-l,2*n-r))-1;  
                 if(width>=U){
                     ans+=width-U+1;
                 }
            }
        }
        printf("Case %d: %d\n",++now,ans);
    }
    return 0;
}




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值