SPOJ 694/705 Distinct Substrings ( 后缀数组 不同子串个数 )

题意 : 求一个字符串中不同子串的个数

思路 : 因为每个子串必然某个后缀的前缀 , 那么我们只要计算这些后缀中不同前缀的个数。我们按照sa的顺序来计算这些前缀数 , 很显然当后缀 sa[i] 必然会有 n - sa[i] 个前缀 , 但是这些前缀可能会与之前的 sa[ j ] ( j < i ) 的前缀冲突 , 冲突的个数就是和前面所有sa[j] 的最大LCP了 , 很显然这个最大LCP就是height[i] , 那么当计算到sa[i]时,实际上有效的前缀是n-sa[i]-height[i] ,最后答案就是n-sa[i]-height[i] 的和


#include <stdio.h>  
#include <string.h>  
#include <algorithm>  
using namespace std;  

#define maxn 1005
#define maxm 1005

int wa[maxn],wb[maxn],wv[maxn],ws[maxm];  

int cmp(int *r,int a,int b,int l)  
{return r[a]==r[b]&&r[a+l]==r[b+l];}  

void da(char *r,int *sa,int n,int m){  
	int i,j,p,*x=wa,*y=wb,*t;  
	for(i=0;i<m;i++) ws[i]=0;  
	for(i=0;i<n;i++) ws[x[i]=r[i]]++;  
	for(i=1;i<m;i++) ws[i]+=ws[i-1];  
	for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;  
	for(j=1,p=1;p<n;j*=2,m=p){  
		for(p=0,i=n-j;i<n;i++) y[p++]=i;  
		for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;  
		for(i=0;i<n;i++) wv[i]=x[y[i]];  
		for(i=0;i<m;i++) ws[i]=0;  
		for(i=0;i<n;i++) ws[wv[i]]++;  
		for(i=1;i<m;i++) ws[i]+=ws[i-1];  
		for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];  
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)  
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  
	}  
}  

int Rank[maxn],height[maxn];  

void calheight(char *r,int *sa,int n){  
	int i , j , k = 0 ;  
	for( i=1 ; i<=n ; i++ ) Rank[sa[i]]=i;  
	for(i=0;i<n;i++) {  
		if(k)k--;  
		int j = sa[Rank[i]-1];  
		while(r[i+k]==r[j+k]) k++ ;  
		height[Rank[i]] = k ;  
	}     
	return;  
}  

int r[maxn] , sa[maxn] ;  
char str[maxn] ;

int main(){  
	int cas ;
	scanf( "%d" , &cas ) ;
	while( cas -- ) {
		scanf( "%s" , str ) ;
		int Max = 0 ;
		int len = strlen( str ) ;
		for( int i = 0 ; i < len ; i ++ ) Max = max( Max , (int)str[i] ) ;
		// 一开始RE , 后来发现字符串不一定是大写字母 , 以后字符范围还是直接求最大值 , 然后数组开大点靠谱 , 不要想当然了
		/*
		for( int i = 0 ; i < len ; i++ ) {
			if( str[i] >= 'A' && str[i] <= 'Z' ) continue ;
			else while( true ) ;
		}*/
		da( str , sa , len + 1 , Max + 1 ) ;
		calheight( str , sa , len ) ;
		int ans = 0 ;
		for( int i = 1 ; i <= len ; i ++ )
			ans += len - sa[i] - height[i] ;
		printf( "%d\n" , ans ) ;
	}
	return 0 ;  
}  


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值