前言
在学这个算法时,我本人也是怎么理解这个算法,故写这篇博客来记录这个算法
一、题目背景
假设有一个主串 S = “hello world!”, 子串 p = “world” 。现在我们需要寻找子串 p 在 主串中的位置
二、暴力求解
char s[n],p[m];
for(int i = 0; i < n; i ++)
{
bool flag = true; // 最开始是匹配成功的状态
for(int j = 0; j < m; j ++)
{
if(s[i + j] != p[j])
{
flag = false;
break;
}
}
if(flag == true)
{
cout << i + 1;
return 0;
}
}
三、kmp算法
1.暴力做法的缺陷及优化
主串的指针走向i 节点,但是匹配到j处主串(蓝)和子串(红)出现不同。此时,暴力求解会主串的指针会走向i + 1节点,实际上可能可以多往后走几个节点。
举个栗子:
存在P[ 0 ] ~ P[ k ] = P[ j - k ] ~ P[ j ] ,这个只于子串有关系,所以可以对子串进行预处理:对于每一个点以某个点为终点的后缀和我的前缀相等,相等的长度最大是多少,这也就是next数组的含义。
Orz,感觉还是讲不明白, 直接上代码吧
2.代码
#include<bits/stdc++.h>
using namespace std;
const int N = 100010, M = 100010;
char s[N],p[M];
int n,m;
int ne[N];//next数组
int main()
{
cin >> n >> p + 1;//从p[1]开始存
cin >> m >> s + 1;
//预处理
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
//匹配过程
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == n)
{
printf("%d ", i - n + 1);//匹配成功的起始位置
//如果只要第一个匹配成功的位置 下部可以加个 return 0;
j = ne[j];
}
}
return 0;
}
如果有错误的话,请指正。