题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=4629
题目大意:给定两个串S和T,从S中找两个子串组成T(拼起来和T一模一样),两个子串可重叠,问有几种组合方法?
解题思路:这题可用KMP解。第一步是要找到T中的每个前缀在S中出现了几次,最开始的想法是将S拼到T后面,然后计算next数组,再对next数组排序,找到比next[i] = L大的个数,就是前缀长度为L的出现次数。这无疑是错的,但拼接的方法还是可取的,只要经过处理,把next数组的各值映射到一个cnt数组(cnt[i]表示前缀长度为i的子串出现几次)中,然后再递归,让cnt[next[i]] += cnt[i]。这是一种处理方法,但是后来我用了另一种方法,直接用T去匹配S,匹配到T中的T[j]时,说明长度为j的前缀出现了,更新cnt[j],然后通过递归计算cnt[next[i]] += cnt[i]。为什么要这样计算呢?因为当某个前缀是另一个前缀的后缀时,会出现少计算的情况,更新的时候只更新后面那个前缀的出现次数而不更新前面的前缀。比如aabaa,aa和aabaa两个前缀就会出现少计算的情况,最后需要cnt[2] += cnt[5]。
这样处理得到了一个关于前缀出现次数的数组,也就是T的前部分【0,j】,那我们怎么得到后部分出现的次数呢?我们不能每次都枚举【j,lenT】。其实,可以将两个字符串反转,再用相同的处理方法处理,最后得到cnt2数组。最后进行计算,for (i = 1; i < len; ++i) ans += cnt[i] * cnt[len-i],还是挺容易理解的。
测试数据:
10
aaabbb
ab
abcd
aabb
代码:
#include <stdio.h>
#include <string.h>
#include <algorithm>
using namespace std;
#define MAX 210000
long long ans;
int n,m,len1,len2;
char s1[MAX],s2[MAX],s3[MAX],c;
int next1[MAX],next2[MAX];
int cnt1[MAX],cnt2[MAX];
void GetNext(int *next,char *s2) {
//获取s2的next数组
int i = 0,j = -1;
next[i] = -1;
while (i < len2) {
if (j == -1 || s2[i] == s2[j])
i++,j++,next[i] = j;
else j = next[j];
}
}
void Match(int *next,int *cnt) {
//s2去匹配s1,并记录每个子串出现几次
int i = 0,j = 0;
while (i < len1) {
if (j == -1 || s1[i] == s2[j])
i++,j++,cnt[j]++;
else j = next[j];
}
for (i = len2; i >= 0; --i)
if (next[i] != -1) cnt[next[i]] += cnt[i];
}
void Reserve(char *s,int len) {
//将字符串s反转
for (int i = 0; i < len / 2; ++i)
c = s[i],s[i] = s[len-i-1],s[len-i-1] = c;
}
long long Solve() {
//计算答案
for (int i = 1; i < len2; ++i)
ans += (long long)cnt1[i] * cnt2[len2-i];
return ans;
}
int main()
{
int i,j,k,t;
scanf("%d",&t);
while (t--) {
scanf("%s%s",s1,s2);
len1 = strlen(s1);
len2 = strlen(s2);
memset(cnt1,0,sizeof(cnt1));
memset(cnt2,0,sizeof(cnt2));
GetNext(next1,s2); //s1拼到s2后面
Match(next1,cnt1);
Reserve(s1,len1);
Reserve(s2,len2);
GetNext(next2,s2);
Match(next2,cnt2);
ans = 0,Solve();
printf("%lld\n",ans);
}
}
本文ZeroClock原创,但可以转载,因为我们是兄弟。