PowerString这道题所带来的KMP字符串匹配算法的小知识点
之前记录了KMP算法的简单模板。一个是KMP_Index 和 KMP_Count前者用于解决模式串在主串中第一次出现的位置。后者算是KMP的拓展,计算模式串在主串中出现了多少次。
KMP算法的核心是next 数组的理解和应用。简单的KMP例题直接套用模板,稍微复杂一些的题目就要去思考next 数组和题目之间的联系。关于next 数组的理解并不是到位。通过做Power String这道题发现一个小知识。判断主串中是否有最小重复单元,并由最小重复单元重复构成主串的次数。 用的就是next 数组
证明或者是 说明摘抄自网络
对于数组s[0-n-1],计算next[0-n](多计算一位)。
考虑next[n],假设t=n-next[n],如果n%t==0,则t就是问题的解,否则解为1。
这样考虑:
比如字符串"abababab",
字符串 a b a b a b a b *
next : -1 0 1 2 3 4 5 6 7
考虑这样的模式匹配,将"abababab#"当做主串,"abababab*"当做模式串,于是进行匹配到n(n=8)时,出现了不匹配:
主串 abababab#
模式串 abababab*
于是模式串需要回溯到next[*]=7,这之前的主串和模式串对应相等,于是需要模式串向右滚动的位移是d=n-next[n]=2,即:
下标 123456789
主串 abababab#
模式串 abababab*
于是可以看出,s[0-1]=s[3-4]=s[5-6]=s[7-8]。
所以位移d=n-next[n]可以看作是构成字符串s的字串(如果n%d==0,存在这样的构成),相应的重复次数也就是n/d。
n-next[n]也就是当前最小匹配的字串长度。。。。。此处的next数组相当于代码中的p数组…
/*
* Do not go gentle into that good night
* ----Dylan Thomas
* Author: looooop
* Created Time: 2019年01月22日 星期二 15时19分03秒
* File Name: Power_line.cpp
*/
#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cmath>
#include <algorithm>
#include <string>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <time.h>
using namespace std;
#define lson 2*i
#define rson 2*i+1
#define LS l,mid,lson
#define RS mid+1,r,rson
#define UP(i,x,y) for(i=x;i<=y;i++)
#define DOWN(i,x,y) for(i=x;i>=y;i--)
#define MEM(a,x) memset(a,x,sizeof(a))
#define gcd(a,b) __gcd(a,b)
#define LL long long
#define N 1000005
#define MOD 1000000007
#define INF 0x3f3f3f3f
#define EXP 1e-8
#define lowbit(x) (x&-x)
#define MAX 10000007
const int maxint = -1u>>1;
char text[MAX];
int Next[MAX];
void getNext(char x[]) { //求Next数组,传参传入模式串。
int j,k;
j = 0; k = -1; Next[0] = -1;
int length_x = strlen(x);
while(j < length_x) {
if(k == -1 || x[j] == x[k])
Next[++j] = ++k;
else
k = Next[k];
}
}
int KMP_Count(char pattern[],char text[]) { //KMP_Count计算主串中有多少的模式串,传入参数pattern(模式串),text(主串)
int ans = 0;
int i,j = 0;
int length_pattern = strlen(pattern);
int length_text = strlen(text);
if(length_pattern == 1 && length_text == 1) {
if(pattern[0] == text[0])
return 1;
else
return 0;
}
getNext(pattern);
for( i = 0; i < length_text; i++) {
while(j>=0 && text[i] != pattern[j])
j = Next[j];
if(j == -1||text[i] == pattern[j])
j++;
if(j == length_pattern) {
ans++;
j = Next[j];
}
}
return ans;
}
int KMP_Index(char pattern[],char text[]) {
int i = 0,j = 0;
getNext(pattern);
int length_pattern = strlen(pattern);
int length_text = strlen(text);
while(i < length_text && j < length_pattern) {
if(j == -1 || text[i] == pattern[j]) {
i++;
j++;
}
else
j = Next[j];
}
if(j == length_pattern)
return i-length_pattern;
else
return -1;
}
int main(int argc,char *argv[]) {
while(scanf("%s",text),text[0] != '.') {
/* if(text[0] == '.') break; */
getNext(text);
int length = strlen(text);
bool flag = true;
int Max = 0;
if (length % (length-Next[length]) == 0) {
printf("%d\n", length/(length-Next[length]));
}
else {
printf("1\n");
}
}
return 0;
}