【字符串处理】【POJ 2406 】字符串最小环节的应用

题目链接:http://poj.org/problem?id=2406

设文本为T={t1,t2...tn},模式为P={p1,p2...pn},则KMP算法的大概思想就是提前计算出在字符处匹配中遇到前q个字符匹配而第q+1个字符不匹配时,模式P需要移动的位置数。在算法导论中,引入了一个数组π,用于保存这样的信息。π[m]的含义就是既是Pm的前缀又是Pm的真后缀的最大子串长度。之所以是“真”后缀,是因为如果非真后缀的话,此时已经匹配了。π的含义如下

i      1 2 3 4 5 6 7  8

pi    a b a b a b a b

π[i]  0 0 1 2 3  4 5 6

而需要特别注意的是算法导论中的下标是从1开始的,这是和π中元素的含义(即上面所说)相匹配的,这种情况下,如果遇到不匹配的字符时,移动量的计算公式为最后一个匹配字符的索引(设为q)-π[q]。如

1 2 3 4 5 6  7

a b a b a b c

a b a b a b d

那么此时需要移动的量为6-π[6]=6-4=2。而在具体的代码实现时,我们需要计算的是next数组,next数组的计算结果和π有一点点的不相同,因为在代码实现中,我们的下标都是从0开始的。仍以上面的例子为例:

i           0  1 2 3 4 5 6  7  8

pi         a  b a b a b a b

next[i]  -1  0 0 1 2 3  4 5 6//注意next中-1后有两个0,看了几个网上的答案,都是一个,需要特别注意。

此时,如果遇到不匹配的字符时,计算公式为第一个不匹配字符的索引(设为q)-next[q]。如:

0  1 2 3 4 5  6

a  b a b a b c

a  b a b a b d

-1 0 0 1 2 3 4

则需要移动的量为6-4=2。而此时的next数组的含义也不再是算法导论中真后缀的最大前缀子串的长度了。

 

 

目前还不太理解。。

问题是:如何快速找出S的最小循环周期(循环节)呢?
Len是s的长度

给出结论:如果len%(len-next[len-1])==0,则字符串中必存在最小循环节,且循环次数即为 len/(len-next[len-1])

 

 

  1. #include<iostream>
  2. #include<cstdio>
  3. #include<cstring>
  4. using namespace std;
  5. char s[ 1000001];
  6. int next[ 1000001];
  7. void getnext(char *p,int *next){
  8. int len= strlen(p);
  9. int i= 0,k= -1;
  10. next[ 0]= -1;
  11. while(i<len){
  12. if(k== -1 || p[i]==p[k]){
  13. i++;
  14. k++;
  15. next[i]=k;
  16. }
  17. else
  18. k=next[k];
  19. }
  20. }
  21. int main(){
  22. while( 1){
  23. scanf( "%s",s);
  24. if(s[ 0]== '.')
  25. break;
  26. getnext(s,next);
  27. int len= strlen(s);
  28. if(len%(len-next[len])== 0)
  29. printf( "%d\n",len/(len-next[len]));
  30. else
  31. printf( "1\n");
  32. }
  33. return 0;
  34. }


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值