字符串匹配指有一个文本串S和一个模式串P,现在要查找P在S中的位置。
主要有以下算法:
其中朴素算法和KMP算法我们在这边bloghttp://blog.csdn.net/lu597203933/article/details/41124815中已经讲解过。RP算法时间复杂度较高,我也没看,想看可以看算法导论。这里主要讲解有限自动机的字符串匹配算法。
有限自动机的定义:
有限自动机字符串匹配主要是构建一个状态转移函数。&(q,a)表示状态q<其中状态q表示已经匹配成功q个字符了>接收字符a后的状态,就等于Pqa(接收成功的q个字符连接上a)后缀的最长P前缀的长度。
例子:
伪代码:
代码如下:
#include <iostream>
#include <string>
using namespace std;
#define MAXSIZE 10
int transitionArray[MAXSIZE][MAXSIZE];
void computingTransition(const string &p, const string &alpha){
for(int q = 0; q < p.size(); q++){ // 初始状态q = 0
for(int i = 0; i < alpha.size(); i++){ // 所拥有的字母表
int k = q+1;
string s = p.substr(0, q)+ alpha[i];
bool flag = false;
for(; k > 0 && !flag; k--){
int j = 0;
for( ;j < k; j++){
if(p[j] != s[s.size()-k+j])break;
}
if(j == k) flag= true;
}
if(flag) transitionArray[q][i] = ++k;
else transitionArray[q][i] = 0;
cout << transitionArray[q][i] << " ";
}
cout << endl;
}
}
void finiteAutomationStringMatch(const string &s, int m){
int q = 0;
int i = 0;
for(int i = 0; i < s.size(); i++){
q = transitionArray[q][s[i]-97];
if(q == m){
cout << "YES" << endl;
cout << i-m+1 << endl;
break;
}
}
if(i == s.size())
cout << "NO" << endl;
}
int main(){
string s("abababacaba"), p("ababaca");
string alpha = "abc";
computingTransition(p, alpha);
finiteAutomationStringMatch(s, p.size());
return 0;
}
结果: