关闭

SPOJ 694 Distinct Substrings

346人阅读 评论(0) 收藏 举报

http://www.spoj.pl/problems/DISUBSTR/

题意:给定一个字符串,len<=1000,求不同子串的个数。

思路: 后缀数组。 每个子串一定是某后缀前缀,于是原问题就可以转换为求所有后缀中不同前缀的个数,后缀的排列顺序为字典序排序suffix(sa[1]) < suffix(sa[2] ) < suffix(sa[3])  ....  ,由后缀的排列顺序我们可以得出,由后缀suffix(sa[k]) 产生的新前缀的个数为:len - sa[k] - height[k] ,因为此时suffix(sa[k]) 与 suffix(sa[k-1]) 共有height[k]个前缀是相同的。这样在用O(NlogN)的复杂度求出sa[]数组和 O(N)的复杂度求出height[] 数组之后就可以在O(N)的时间内求出答案。总的复杂度为:O(NlogN)。

代码:

#include<stdio.h>
#include<string.h>
#define MAXN 2010 
char ch[MAXN] ;
int num[MAXN] ;
int T;
int sa[MAXN] , rank[MAXN] ,height[MAXN] ;  
int wa[MAXN] , wb[MAXN] ,wv[MAXN],wd[MAXN] ;   
int N,M;  
int cmp(int *r , int a , int b , int l){  
    return r[a] == r[b] && r[a+l] == r[b+l] ;     
}  
void DA(int *r,int n,int m){        //O(NlogN)  
    int i, j , p , *x=wa, *y=wb,*t ;  
    for( i = 0 ; i < m ; i++ )   wd[i] = 0 ;  
    for( i = 0 ; i < n ; i++ )       wd[x[i]=r[i]] ++ ;  
    for( i = 1 ; i < m ; i++ )       wd[i] += wd[i-1] ;  
    for( i = n-1 ;i >= 0 ; i-- )     sa[--wd[x[i]]] = i ;  
    for( j = 1 , p = 1 ; p < n; j *= 2 , m=p ){  
        for( p = 0 , i = n-j ; i < n ; i++)  y[p++] = i ;  
        for( i = 0 ; i < n ; i++ )   if(sa[i] >= j)   y[p++] = sa[i] - j ;  
        for( i = 0 ; i < n ; i++)    wv[i] = x[y[i]] ;  
        for( i = 0 ; i < m ; i++)    wd[i] = 0 ;  
        for( i = 0 ; i < n ; i++)    wd[wv[i]] ++ ;  
        for( i = 1 ; i < m ; i++)    wd[i] += wd[i-1] ;  
        for( i = n-1 ; i >= 0 ; i--) sa[ --wd[wv[i]]] = y[i] ;  
        for( t = x , x = y , y = t , p = 1 , x[ sa[0] ] = 0,i = 1;i < n ; i++){  
            x[sa[i]] = cmp( y ,sa[i-1] ,sa[i] , j ) ? p-1: p++;   
        }     
    }  
}   
  
void calHeight(int *r , int n){  
    int i , j , k = 0 ;  
    for( i = 1 ; i <= n ; i++)   rank[sa[i]] = i ;  
    for( i = 0 ; i < n ; height[ rank[i++]]=k){  
        for( k ? k-- : 0 , j=sa[rank[i]-1]; r[i+k]==r[j+k] ; k++) ;   
    }     
}
int main(){
	scanf("%d",&T);
	while(T--){
		scanf("%s",ch);	
		int len = strlen(ch);
		for(int i=0;i<len;i++){
			num[i] = ch[i] ;	
		}
		num[len] = 0 ;
		DA(num, len+1 , 300);
		calHeight(num,len);
		int ans = len - sa[1] ;
		for(int i=2;i<=len;i++){
			ans += len - sa[i] - height[i] ;
		}
		printf("%d\n",ans);
	}		
	return 0 ;	
}


0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:202953次
    • 积分:4162
    • 等级:
    • 排名:第7400名
    • 原创:212篇
    • 转载:17篇
    • 译文:0篇
    • 评论:42条
    最新评论