题意:
在一个合法串中:每位上有多个可选字符(数字),求母串中有多少个这样的合法子串。
注意:用gets和puts,并且选择G++而不是C++!(否则TLE)
分析:
一开始写了KMP算法,结果发现没有可重复性,退化为O(n^2),TLE;
正解为ShiftAnd算法,用bitset实现,复杂度为O(n);
1.bitset B[i][j]==1表示数i可以在第j位出现;
2.维护一个bitset ans;
3.每进入一个阶段i(母串中第i位),ans左移一位(ans<<=1),然后对ans的最低位(第0位)赋1(ans[0]=1/ans.set(0));
4.然后ans与B[s[i]-‘0’]按位与(ans&=B[s[i]-‘0’]);
5.如果ans[n-1]==1,则说明i-n+1,i-n+2,….,i位全部匹配了,输出。
为什么这样是对的呢?
1.假设只看ans中最高位的1,例如ans=(1101),可以知道最高位的1是从i往左3位处获得的,最高位的1处在ans的从右往左第3位,正好对应了s[i]处在子串的第3位,若s[i]处在子串第3位合法,则B[s[i]-‘0’]的第3位一定为1,则其与ans按位与之后第三位仍为1,迭代下去,若ans的第n-1位为1,则说明i-n+1,i-n+2,….,i位全部匹配了。
2.不处于最高位的1仍然满足(1.)中的推演过程,若最高位的1被按位与掉了,则次高位的1变为最高位。
代码:
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <bitset>
using namespace std;
const int Tmax=5000005;
int n,slen;
char s[Tmax],tmp='\0';
bitset<1001> B[20],ans;
int main()
{
int i,a,b,j;
while(scanf("%d",&n)==1)
{
for(i=0;i<=n;i++) B[i].reset();
ans.reset();
for(i=0;i<n;i++)
{
scanf("%d",&a);
for(j=1;j<=a;j++)
{
scanf("%d",&b);
B[b].set(i);
}
}
getchar();gets(s);
slen=strlen(s);
for(i=0;i<=slen;i++)
{
ans<<=1;
ans.set(0);
ans=ans&B[s[i]-'0'];
if(ans[n-1]==1)
{
swap(tmp,s[i+1]);
puts(s+i-n+1);
swap(tmp,s[i+1]);
}
}
}
return 0;
}
总结:
ShiftAnd算法可以说是看透了KMP算法的本质,利用01位运算的方法令人折服,比KMP快至少2倍以上,也是O(n)的线性算法,其适用于子串长度较小的时候。