Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)
Problem Description
有一个文本串,它的长度为m(1≤m≤2000000),现在想找出其中所有的符合特定模式的子串位置。
符合特定模式是指,该子串的长度为n(1≤n≤500),并且第i个字符需要在给定的字符集合Si中。
因此,描述这一特定模式,共需要S1,S2,…,Sn这n个字符集合。每个集合的大小都在1∼62之间,其中的字符只为数字或大小写字母。
Input
第一行为一个字符串,表示待匹配的文本串。注意文本串中可能含有数字和大小写字母之外的字符。
第二行为一个整数n。
以下n行,分别描述n个字符集合。每行开始是一个1∼62之间的整数,随后有一个空格,接下来有一个字符串表示对应字符集合的内容。整数表示字符集合的大小,因此它也就是字符串的长度。输入保证字符串中的字符只为数字或大小写字母且没有重复。(注:本题有多组测试数据)
Output
每当从某个位置开头的,长度为n的子串符合输入的模式,就输出一行,其中包含一个整数,为它在文本串的起始位置。位置编号从1开始。
如果文本串没有任何位置符合输入模式,则最后输出一个字符串”NULL”,占一行。
Sample Input
aaaabacabcabd
3
3 abc
2 bc
3 abc
Sample Output
4
6
8
9
Solution
一道shift-and算法的板题,只不过要多位同时进行匹配。shift-and算法主要通过位运算进行操作,恰好可使用 bitset b i t s e t 压位优化。注意使用滚动数组优化空间。
Code
#include<stdio.h>
#include<algorithm>
#include<iostream>
#include<cstdlib>
#include<cstring>
#include<bitset>
#include<cmath>
using namespace std;
const int maxn=2e6+5;
int n,m,len,tot,id[256];
char c[65],s[maxn];
bitset<505> f[2],g[256];
void Init()
{
for(char i='0';i<='9';i++) id[i]=++tot;
for(char i='a';i<='z';i++) id[i]=++tot;
for(char i='A';i<='Z';i++) id[i]=++tot;
}
void Shift_And()
{
bool flag=false;
f[0].reset(),f[0][0]=1;
for(int i=1,j=1;i<=m;j^=1,i++)
{
f[j]=f[j^1]<<1&g[id[s[i]]],f[j][0]=1;
if(f[j][n]) printf("%d\n",i-n+1),flag=true;
}
if(!flag) puts("NULL");
}
int main()
{
Init();
while(gets(s+1))
{
m=strlen(s+1),scanf("%d",&n);
for(int i=1;i<=tot;i++) g[i].reset();
for(int i=1;i<=n;i++)
{
scanf("%d%s",&len,c+1);
for(int j=1;j<=len;j++) g[id[c[j]]][i]=1;
}
Shift_And(),getchar();
}
return 0;
}