关闭

【POJ 2406 】

331人阅读 评论(0) 收藏 举报
分类:

题目链接:http://poj.org/problem?id=2406

设文本为T={t1,t2...tn},模式为P={p1,p2...pn},则KMP算法的大概思想就是提前计算出在字符处匹配中遇到前q个字符匹配而第q+1个字符不匹配时,模式P需要移动的位置数。在算法导论中,引入了一个数组π,用于保存这样的信息。π[m]的含义就是既是Pm的前缀又是Pm的真后缀的最大子串长度。之所以是“真”后缀,是因为如果非真后缀的话,此时已经匹配了。π的含义如下

i      1 2 3 4 5 6 7  8

pi    a b a b a b a b

π[i]  0 0 1 2 3  4 5 6

而需要特别注意的是算法导论中的下标是从1开始的,这是和π中元素的含义(即上面所说)相匹配的,这种情况下,如果遇到不匹配的字符时,移动量的计算公式为最后一个匹配字符的索引(设为q)-π[q]。如

1 2 3 4 5 6  7

a b a b a b c

a b a b a b d

那么此时需要移动的量为6-π[6]=6-4=2。而在具体的代码实现时,我们需要计算的是next数组,next数组的计算结果和π有一点点的不相同,因为在代码实现中,我们的下标都是从0开始的。仍以上面的例子为例:

i           0  1 2 3 4 5 6  7  8

pi         a  b a b a b a b

next[i]  -1  0 0 1 2 3  4 5 6//注意next中-1后有两个0,看了几个网上的答案,都是一个,需要特别注意。

此时,如果遇到不匹配的字符时,计算公式为第一个不匹配字符的索引(设为q)-next[q]。如:

0  1 2 3 4 5  6

a  b a b a b c

a  b a b a b d

-1 0 0 1 2 3 4

则需要移动的量为6-4=2。而此时的next数组的含义也不再是算法导论中真后缀的最大前缀子串的长度了。

 

 

目前还不太理解。。

问题是:如何快速找出S的最小循环周期(循环节)呢?
Len是s的长度

给出结论:如果len%(len-next[len-1])==0,则字符串中必存在最小循环节,且循环次数即为 len/(len-next[len-1])

 

 

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char s[1000001];
int next[1000001];
void getnext(char *p,int *next){
	int len=strlen(p);
	int i=0,k=-1;
	next[0]=-1;
	while(i<len){
		if(k==-1 || p[i]==p[k]){
			i++;
			k++;
			next[i]=k;
		}
		else
			k=next[k];
	}
}
int main(){
	while(1){
		scanf("%s",s);
		if(s[0]=='.')
			break;
		getnext(s,next);
		int len=strlen(s);
		if(len%(len-next[len])==0)
			printf("%d\n",len/(len-next[len]));
		else
			printf("1\n");
	}
	return 0;
}

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:106003次
    • 积分:2962
    • 等级:
    • 排名:第11834名
    • 原创:198篇
    • 转载:15篇
    • 译文:0篇
    • 评论:6条