#include<stdio.h>
#include<string.h>
#include<stdlib.h>
void get_nextval(char* s, int* nextval)
{
int i = 0;
int j = -1;
nextval[0] = -1;
while (i < strlen(s)-1)
{
if (j == -1 || s[i] == s[j])
{
i++;
j++;
if (s[i] != s[j])
{
nextval[i] = j;
}
else {
nextval[i] = nextval[j];
}
}
else {
j = nextval[j];
}
}
}
int kmp(char* s, char* t)
{
int size = strlen(t);
int* nextval = (int*)malloc(sizeof(int) * strlen(t));
get_nextval(t, nextval);
int i = 0;
int j = 0;
while (i < strlen(s) && j < strlen(t))
{
if (s[i] == t[j])
{
i++;
j++;
}
else {
j = nextval[j];
}
}
if (j >= size)
{
return i - size;
}
else {
return -1;
}
}
int main()
{
char s[] = "aaaaaaaacaaaaaadaacdaaaab";
char t[] = "aaaac";
int locate=kmp(s, t);
printf("字符串位置为:%d", locate);
return 0;
}
在写kmp算法最后一步的判断语句时,一开始我用的是:
if (j >= strlen(t))
{
return i - strlen(t);
}
else {
return -1;
}
但在调试过程中,这里出现了很隐蔽的错误,如当j=-1,strlen(t)为5时,显然-1>=5为假,但这里一直判断为真。查阅资料后发现,问题来源于strlen返回为unsigned int,编译器执行时会将j的类型上升到unsigned ,此时j的值就变成一个很大的数,故条件判断永远为真。解决办法就是在strlen前面强转为int 或定义一个int形变量接受strlen 的值,再用j与新定义的变量做判断。