题意:给出一个文本串T和模式串P,求P的任意前缀和后缀的组合(前缀和后缀不能是原串P)在T中出现的总次数。
思路:KMP算法思想,首先我们需要求出T中以每个位置i结束的前缀数量ans1[i],然后我们将T翻转,类似地求出以每个位置i结束的后缀数量,那么答案就是任意相邻两个位置的前缀数量*后缀数量之和。
以求前缀数量为例,这里用到了KMP算法的思想,首先预处理出模式串P中以位置i结尾的所有前缀数量,记为pre[i],那么我们对T进行匹配的时候,当T[j]位置和字符串P的前i项匹配时,更新ans1[j] = pre[i],那么我们就可以求出ans1数组了。
现在问题转化为了预处理pre数组,这里用的是递推+KMP的思想,对于当前的位置i,我们观察f[i+1]的值(KMP中的失配函数),
1.如果f[i+1]为0,那么pre值为1
2.如果f[i+1]不为0,那么pre[i] = pre[f[i+1]-1] + 1。
之所以这么做,其实因为f[i+1]就代表以位置i结尾的最长前缀的长度,那么f[i+1]-1就代表前缀的位置,于是就可以递推了。
这道题其实很不错,要深入理解KMP算法,否则不容易一下想到。
#include<cstdio>
#include<cstring>
#include<cmath>
#include<cstdlib>
#include<iostream>
#include<algorithm>
#include<vector>
#include<map>
#include<queue>
#include<stack>
#include<string>
#include<map>
#include<set>
#include<ctime>
#define eps 1e-6
#define LL long long
#define pii pair<int, int>
//#pragma comment(linker, "/STACK:1024000000,1024000000")
using namespace std;
const int MAXN = 55000;
//const int INF = 0x3f3f3f3f;
char P[MAXN], T[MAXN];
int f[MAXN], pre[MAXN], suf[MAXN], ans1[MAXN], ans2[MAXN];
void getFail(char* P) {
int m = strlen(P);
f[0] = 0; f[1] = 0;
for(int i = 1; i < m; i++) {
int j = f[i];
while(j && P[i]!=P[j]) j = f[j];
f[i+1] = P[i]==P[j] ? j+1 : 0;
}
}
void find_p(char* T, char* P, int* ans, int* pre) {
int n = strlen(T), m = strlen(P);
int j = 0;
for(int i = 0; i < n; i++) {
while(j && P[j]!=T[i]) j = f[j];
if(P[j] == T[i]) ans[i] = pre[j], j++;
else ans[i] = 0;
if(j == m) ans[i]--;
}
}
void rev(char* s) {
int len = strlen(s);
for(int i = 0; i < len/2; i++) swap(s[i], s[len-1-i]);
}
int main() {
//freopen("input.txt", "r", stdin);
int t, kase = 0;
cin >> t;
while(t--) {
scanf("%s%s", T, P);
int len = strlen(P);
int len2 = strlen(T);
getFail(P);
pre[0] = 1;
for(int i = 1; i < len; i++) {
if(!f[i+1]) pre[i] = 1;
else pre[i] = pre[f[i+1]-1] + 1;
}
find_p(T, P, ans1, pre);
rev(P);
rev(T);
getFail(P);
suf[0] = 1;
for(int i = 1; i < len; i++) {
if(!f[i+1]) suf[i] = 1;
else suf[i] = suf[f[i+1]-1] + 1;
}
find_p(T, P, ans2, suf);
LL ans = 0;
//for(int i = 0; i < len2-1; i++) cout << i << " " << ans1[i] << " " << ans2[len2-2-i] << endl;
for(int i = 0; i < len2-1; i++) ans += (LL)ans1[i]*ans2[len2-2-i];
printf("Case %d: ", ++kase);
cout << ans << endl;
}
return 0;
}