适用范围:字符串匹配问题
28. 找出字符串中第一个匹配项的下标 - 力扣(LeetCode)
第一步:求出模式串next数组(前缀表)
前缀表:
void getNext(int *next,const string& s)//传入next数组,和模式串s
{
next[0]=0;//模式串的第一个元素的next是0;
int j=0;
for(int i=1;i<s.size();++i)//从1开始遍历
{
while(j>0&&s[i]!=s[j])
{
j=next[j-1];
}
if(s[i]==s[j])
{
j++;
}
next[i]=j;
}
}
第二步,进行与文本串KMP匹配
for(int i=0,j=0;i<p.size();++i)//p为文本串,将文本串遍历一遍进行匹配
{
while(j>0&&p[i]!=s[j])
{
j=next[j-1];//不匹配时,让j等于next[j-1]里的值,接着继续匹配
}
if(p[i]==s[j])
{
j++;
}
if(j==s.size())
{
cout<<i-j+1<<endl;//输出为第一个匹配项的下标
}
}
例题:
给定一个字符串 𝑆,以及一个模式串 𝑃,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 𝑃 在字符串 𝑆 中多次作为子串出现。
求出模式串 𝑃 在字符串 𝑆 中所有出现的位置的起始下标。
输入格式
第一行输入整数 𝑁,表示字符串 𝑃 的长度。
第二行输入字符串 𝑃。
第三行输入整数 𝑀,表示字符串 𝑆 的长度。
第四行输入字符串 𝑆。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤𝑁≤10^5
1≤𝑀≤10^6
输入样例:
3
aba
5
ababa
输出样例:
0 2
套用KMP算法:
#include<iostream>
using namespace std;
#include<string>
const int N=100010;
int ne[N];//定义next数组
int n,m;
string s,p;
int main()
{
cin>>n;
for(int i;i<n;++i)
{
char ch;
cin>>ch;
s+=ch;
}//输入模式串s ,n为模式串的长度
cin>>m;
for(int i=0;i<m;++i)
{
char ch;
cin>>ch;
p+=ch;
}//输入文本串p ,m为文本串的长度
//求next数组
ne[0]=0;
int j=0;
for(int i=1;i<n;++i)
{
while(j>0&&s[i]!=s[j])
{
j=ne[j-1];
}
if(s[i]==s[j])
{
j++;
}
ne[i]=j;
}
//kmp匹配过程
for(int i=0,j=0;i<m;++i)
{
while(j>0&&p[i]!=s[j])
{
j=ne[j-1];
}
if(p[i]==s[j])
{
j++;
}
if(j==n)
{
cout<<i-j+1<<" ";
j=ne[j-1];//匹配成功后,j需要返回ne[j-1]进行下一次的匹配
}
}
return 0;
}
谢谢关注