链接:https://www.nowcoder.com/acm/contest/73/D
来源:牛客网
空间限制:C/C++ 262144K,其他语言524288K
64bit IO Format: %lld
题目描述
白兔有一个字符串T。白云有若干个字符串S1,S2..Sn。
白兔想知道,对于白云的每一个字符串,它有多少个子串是和T循环同构的。
提示:对于一个字符串a,每次把a的第一个字符移动到最后一个,如果操作若干次后能够得到字符串b,则a和b循环同构。
所有字符都是小写英文字母
输入描述:
第一行一个字符串T(|T|<=10^6) 第二行一个正整数n (n<=1000) 接下来n行为S1~Sn (|S1|+|S2|+…+|Sn|<=10^7),max(|S1|,|S2|,|S3|,|S4|,..|Sn|)<=10^6
输出描述:
输出n行表示每个串的答案
写在前面:
这肯定不是正解,算是投机取巧,复杂度O(Kn),K为随机次数(一般大于5就90%AC)
常数很大,但仍然可以在300ms左右内得出答案
考虑KMP,对于当前串S,求出dp[0][x]为以第x个字母结尾能匹配T串的最长长度
之后再把S串和T串同时反过来(S'和T'),再来一次一模一样的KMP,求出dp[1][x]为以第x个字母结尾能匹配T'的最长长度
例如本题样例T:abab;S:abababab,那么有
S:a b a b a b a b
dp[0][x]:1 2 3 4 3 4 3 4
dp[1][x]:4 3 4 3 4 3 2 1
那么"答案"就是dp[1][x]+dp[0][x+|T|-1]>=|T|的个数
这样交上去就可以过95%,然后这方法实际上是错误的,例如样例:T:aba;S:ababa
S:a b a b a
dp[0][x]:1 2 3 2 3
dp[1][x]:3 2 3 2 1
这样的话算出来的答案是3,x=1, 2, 3都满足条件dp[1][x]+dp[0][x+|T|-1]>=|T|,可是实际上答案是2
从x=2开始的子串"bab"不能通过T循环移位得到
那么正解是什么?
很显然dp[1][x]+dp[0][x+|T|-1]>=|T|的个数结论是错的,答案应该是:
令y = x+|T|-1,是否存在一个S串y处的失配指针(或y)y'和一个S'串x处的失配指针x'(或x)满足x'+y'=m
如果有答案+1,否则不加,而不是无脑加
这样也好办,对S和'S'建出fail树,然后在树上瞎搞搞
或者将它们丢及两个集合里,暴力一个集合,在另一个集合里面二分出刚好为m的就行(我看到有个AC代码就是这种写法)
不过这不好写,复杂度O(nlogn)。。(如果只是想知道正解,下面就可以不用看了,建议翻其它题解)
仔细想想你会发现有不算很少的情况下dp[1][x]+dp[0][x+|T|-1]>=|T|时,一定存在一个x'和一个y'满足x'+y'=m
因为既然你两个串S和S'能匹配T和T'的的长度都非常长(之和≥m),就说明字符串T字母集相对比较单一或者对称
而这时如果你将原先的串T直接先循环移动一定长度,①对于字母集单一的串,虽然结构改变不是很大
不过既然字符集不是很大,那么存在一个x'和一个y'满足x'+y'=m的概率不就不会低?
②而对于字符集不怎么单一的串,循环移位整个串的结构就很可能会完全改变!可是改变之后你若是还是满足上述条件
就说明存在一个x'和一个y'满足x'+y'=m的概率又大了一些!
也就是说,对于输入的串T,随机循环移位K次,每随机1次就算一次答案,最后取个最小值输出,答案正确概率就很高了
下面给出一个只用循环移位2次就可以AC的程序
#include<stdio.h>
#include<algorithm>
#include<stdlib.h>
#include<string.h>
using namespace std;
char jud[1000005], str[1000005], temp[1000005];
int net[1000005], dp[2][1000005];
int main(void)
{
int Q, i, j, m, n, k, ans, bet, q, x;
scanf("%s%d", jud+1, &Q);
m = strlen(jud+1);
while(Q--)
{
scanf("%s", str+1);
n = strlen(str+1);
ans = n+1;
for(q=1;q<=2;q++)
{
x = q==2?7:1;
for(i=1;i<=m;i++)
temp[(i+x)%m+1] = jud[i];
for(i=1;i<=m;i++)
jud[i] = temp[i];
for(k=0;k<=1;k++)
{
i = 1, j = 0;
net[1] = 0;
while(i<=m)
{
if(j==0 || jud[i]==jud[j])
{
i++, j++;
if(jud[i]==jud[j]) net[i] = net[j];
else net[i] = j;
}
else
j = net[j];
}
i = j = 1;
while(i<=n)
{
if(str[i]==jud[j])
{
dp[k][i++] = j;
if(j==m) j = net[j+1];
else j++;
}
else
{
j = net[j];
if(j==0)
dp[k][i++] = 0, j = 1;
}
}
for(i=1;i<=m/2;i++)
swap(jud[i], jud[m-i+1]);
for(i=1;i<=n/2;i++)
swap(str[i], str[n-i+1]);
}
bet = 0;
for(i=1;i+m-1<=n;i++)
{
if(dp[1][n-i+1]+dp[0][i+m-1]>=m)
bet++;
}
ans = min(ans, bet);
}
printf("%d\n", ans);
}
return 0;
}