前言
字符串匹配
什么是字符串匹配
朴素字符串匹配算法
KMP算法
给定一个字符串 S ,以及一个模式串 P ,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P 在字符串 S 中多次作为子串出现。
求出模式串 P 在字符串 S 中所有出现的位置的起始下标。
输入格式 第一行输入整数 N ,表示字符串 P 的长度。
第二行输入字符串 P 。
第三行输入整数 M ,表示字符串 S 的长度。
第四行输入字符串 S 。
输出格式 共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1051≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
前言
KMP算法是目前我遇到的第一个比较难的算法,花了一整天时间才算粗略的理解。KMP算法是对字符串匹配的朴素算法做出优化,说起KMP算法让我们先了解字符串匹配。
字符串匹配
什么是字符串匹配
字符串匹配相关的算法有朴素算法,Rabin-Karp算法(这里不做具体介绍),KMP算法, 这里我们主要讨论KMP算法
在编辑文本程序的过程中,我们经常需要在文本中找到某个模式的所有出现位置。典型情况是,一段正在被编辑的文本构成一个文件,而所要搜寻的模式是用户正在输入的特定的关键字,有效的解决这个问题的算法叫做字符串匹配算法,该算法能够极大提高编辑文本程序时的响应效率。在其他很多应用中,字符串匹配算法用于在DNA序列中搜寻特定的序列。在网络搜寻引擎中也需要用这种方法来找到所要查询的网页地址朴素字符串匹配算法
朴素字符串匹配算法是通过一次次的循环不断向后偏移,也就是每次的遍历都需要将子串从头到尾和母串相比较,可以想象成子串不断在母串上滑动,直到所有位置都能匹配或者有一个位置不能匹配。朴素算法代码如下:
for (int i = 0; i < n ; i++)
{
bool flag = true;
for (int j = 0; j < m; j++)
{
if (p[j] != s[i+j])
{
flag = false;
break;
}
}
if