后缀数组(三)求给定字符串不相同的子串个数(hdu 4622 区间询问)

原创 2016年08月28日 16:24:12

如果字符串是给定的,不询问区间,按照论文里写的,由于每个子串一定是某个后缀的前缀,相当于就是求后缀之间不相同前缀的个数。每次新加进来一个后缀,就是加上(n-sa[i]+1)个新前缀,但是其中有height[i]个前面已经算过了,减掉即可。

这题询问的是一个区间[l,r],一开始的思路是,对于每一个sa[i]在l到r之间的后缀,按前面那种方法计算,同时注意考虑一下lcp的右边超过了r的情况,过了样例交就wa了..后来看大神的博客,发现他说他当时错的跟我一样..就是没考虑区间中的sa数组和整个字符串的sa数组不一样的问题(一开始想到了来着..后来不知道为什么忘了..每次都是这样子)解决的办法就是加一句话,判断一下当前的这个后缀和上一个后缀的前后关系在区间中是否是正确的,具体见代码注释那句话

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
using namespace std;
const int maxn=4010;
int sa[maxn],t[maxn],t2[maxn],c[maxn],n,s[maxn],mi[maxn][20];
int Rank[maxn],height[maxn];
char str[maxn];

void rmq()
{
   int i,j;
   for(i=1;i<n-1;i++)mi[i][0]=height[i+1];
   for(j=1;(1<<j)<n-1;j++)
      for(i=1;i+(1<<j)-1<n-1;i++)
         mi[i][j]=min(mi[i][j-1],mi[i+(1<<(j-1))][j-1]);
}

int Q(int l,int r)
{
   int k=(int)(log(1.0*(r-l+1))/log(2.0));
   return min(mi[l][k],mi[r+1-(1<<k)][k]);
}

void get_sa(int m)
{
   int i,*x=t,*y=t2;
   for(i=0;i<m;i++) c[i]=0;
   for(i=0;i<n;i++) c[x[i]=s[i]]++;
   for(i=1;i<m;i++) c[i]+=c[i-1];
   for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
   for(int k=1;k<=n;k<<=1)
   {
      int p=0;
      for(i=n-k;i<n;i++) y[p++]=i;
      for(i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
      for(i=0;i<m;i++) c[i]=0;
      for(i=0;i<n;i++) c[x[y[i]]]++;
      for(i=1;i<m;i++) c[i]+=c[i-1];
      for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];

      swap(x,y);
      p=1;x[sa[0]]=0;
      for(i=1;i<n;i++)
         x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
      if(p>=n) break;
      m=p;
   }
}

void get_height()
{
   int i,j,k=0;
   for(i=1;i<n;i++) Rank[sa[i]]=i;
   for(i=0;i<n-1;i++)
   {
      if(k)k--;
      j=sa[Rank[i]-1];
      while(s[i+k]==s[j+k]) k++;
      height[Rank[i]]=k;
   }
}

int solve(int l,int r)
{
   int i,flag=0,ans=0,tmp=-1,t,b,sum;
   for(i=1;i<n;i++)
   {
      if(sa[i]<=r && sa[i]>=l)
      {
         ans+=(r-sa[i]+1);
         if(!flag) flag=1;
         else
         {
            t=r-max(sa[i],sa[tmp])+1;
            b=Q(tmp,i-1);
            sum=b>t?t:b;
            ans-=sum;
         }
         if(tmp==-1)tmp=i;
         else
         {
            if(sa[tmp]<sa[i] && b>=r-sa[i]+1){}//就是少了这句话就wa了..
            else tmp=i;
         }
      }
   }
   return ans;
}

int main()
{
   int t,i,q,l,r;
   scanf("%d",&t);
   while(t--)
   {
      scanf("%s",str);
      n=strlen(str);
      for(i=0;i<n;i++) s[i]=str[i]-'a'+1;
      s[n++]=0;
      get_sa(30);
      get_height();
      rmq();
      scanf("%d",&q);
      while(q--)
      {
         scanf("%d%d",&l,&r);
         l--;r--;
         printf("%d\n",solve(l,r));
      }
   }
   return 0;
}


版权声明:本文为博主原创文章,未经博主允许不得转载。

后缀数组(不相同的子串个数)——SPOJ 705

对应SPOJ题目:点击打开链接 Distinct Substrings Time Limit: 159MS   Memory Limit: Unknown   64bit IO Forma...

spoj 694 求一个字符串中不同子串的个数

SPOJ Problem Set (classical) 694. Distinct Substrings Problem code: DISUBSTR Gi...

spoj 694 求一个字符串中不相同子串的个数

后缀数组

SPOJ-694-求字符串中不同子串个数(后缀数组)

http://www.spoj.com/status/ns=17418952 【每一个子串必然是某个后缀的前缀】,因此我们统计出所有的后缀中有多少个不同的前缀,就是所有不重复子串的数量了...
  • viphong
  • viphong
  • 2016年08月03日 00:37
  • 831

HDU4622:Reincarnation(后缀数组,求区间内不同子串的个数)

Problem Description Now you are back,and have a task to do: Given you a string s consist of lowe...

ACM中国国家集训队论文集目录(1999-2009)

 国家集训队1999论文集 陈宏:《数据结构的选择与算法效率——从IOI98试题PICTURE谈起》 来煜坤:《把握本质,灵活运用——动态规划的深入探讨》 齐鑫:《搜索方法中的剪枝优化...

北大程序设计实习公开课编程作业,魔兽世界之一:备战

魔兽世界的第一个版本,备战。比较简单。 因为我 take 这个课的时候,课程已经开到第八周了,这些作业已经不能提交。所以该代码没有提交通过 oj 判断,需要大家注意一下。如果以后有人拿此代码交了,没有...

Spoj694(Distinct Substrings)求字符串不相同的子串个数(后缀数组)

/********************************************* 题目地址: http://www.spoj.com/problems/DISUBSTR/ 题目大意: 给...
  • Jarily
  • Jarily
  • 2013年03月23日 19:55
  • 1245

HDU 5769-Substring(后缀数组-不相同的子串的个数)

Substring Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) Tota...
  • MIKASA3
  • MIKASA3
  • 2016年08月07日 11:03
  • 295

SPOJ - DISUBSTR Distinct Substrings(后缀数组求不相同的子串个数)

Description Given a string, we need to find the total number of its distinct substrings. Input ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:后缀数组(三)求给定字符串不相同的子串个数(hdu 4622 区间询问)
举报原因:
原因补充:

(最多只允许输入30个字)