题目链接:点击打开链接
题意: 求一个字符串不重复子串的个数.
思路: 后缀数组的基本应用, 首先预处理出后缀数组sa[]和高度数组lcp[], 我们知道从sa[i]作为第一个元素的子字符串长度为n' = strlen(s) - sa[i], 稍加思考就能发现每个字符串的贡献应该是 n' - lcp[i]. 为什么呢? 由于该子字符串中的前缀已经在别的子字符串中出现过了, 那么我们可以忽略那些出现过的前缀, 而每次操作加入那些新出现的后缀字符串的后缀. 事实证明这样是不会有重复或遗漏.
代码如下:
#include<iostream>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<iomanip>
#include<stdlib.h>
#include<cstdio>
#include<string>
#include<string.h>
#include<set>
#include<stack>
#include<map>
using namespace std;
#define rep(i, n) for(int i=0; i<n ;i++)
#define rep1(i, n) for(int i=1; i<=n; i++)
typedef long long ll;
typedef pair<int,int> P;
const int INF = 0x7fffffff;
const int MAX_N = 1e5+5;
const int MAX_V = 0;
const int MAX_M = 0;
const int MAX_Q = 0;
int n, k;
int rak[MAX_N], sa[MAX_N], lcp[MAX_N], tmp[MAX_N];
string str;
bool compare_sa(int i, int j){
if(rak[i]!=rak[j]) return rak[i]<rak[j];
else{
int ri = i+k<=n? rak[i+k]: -1;
int rj = j+k<=n? rak[j+k]: -1;
return ri<rj;
}
}
void construct_sa(string s, int* sa){
n = s.length();
for(int i=0; i<=n; i++){
sa[i] = i;
rak[i] = i<n?s[i]:-1;
}
for(k=1; k<=n; k<<=1){
sort(sa, sa+n+1, compare_sa);
tmp[sa[0]] = 0;
for(int i=1; i<=n; i++){
tmp[sa[i]] = tmp[sa[i-1]] + (compare_sa(sa[i-1], sa[i])?1:0);
}
for(int i=0; i<=n; i++)
rak[i] = tmp[i];
}
}
void construct_lcp(string s, int* sa, int* lcp){
for(int i=0; i<=n; i++) rak[sa[i]] = i;
int h=0;
lcp[0] = 0;
lcp[n] = 0;
for(int i=0; i<n; i++){
int j = sa[rak[i]-1];
if(h>0) h--;
for(; j+h<n && i+h<n; h++)
if(s[j+h]!=s[i+h])
break;
lcp[rak[i]-1] = h;
}
}
void solve(){
cin>>str;
construct_sa(str, sa);
construct_lcp(str, sa, lcp);
ll res = 0;
//cout<<sa[n]<<" "<<lcp[n]<<endl;
for(int i=0; i<=n; i++){
res += n - sa[i] - lcp[i];
}
cout<<res<<endl;
}
int main(){
ios::sync_with_stdio(false);
int T; cin>>T;
while(T--)
solve();
}