问题引入
字符串的匹配和搜索进行代码实现并不是很难,如果使用“暴力”的方法求解也可以实现,但实际上并不赞同使用暴力算法,因此,如何快速、高效的匹配字符串是一个越来越被重视的问题。
传统的字符串匹配算法基本上是从关键字与字符串的开头开始比对,尽管字符串的匹配在不断改进着,例如 Knuth-Morris-Pratt 演算法 ,简称“KMP算法”,由D.EKnuth与V.R.Pratt和J.H.Morris同时发现,因此也称为克努特-莫里斯-普拉特操作。KMP算法是对传统字符串匹配算法的一种改进,主要的改进在于“每一趟进行字符匹配出现字符不相等的情况时,不需回溯i指针,而是利用已经的得到的匹配部分的结果将模式向右滑动尽可能远的一段距离后继续进行比较”,其借助数组进行标记,虽然在一定程度上提高了字符串匹配效率,但是计算的推导较复杂。
Boyer-Moore字串核对改由关键字的后面开始核对字符串,并制作前进表,如果比对不符合则依前进表中的值前进至下一个核对处。假设字符p匹配好了,然后比对字符串中p-n+1至p的值是否与关键字相同。
如果关键字中有重复出现的字符,则前进值就会有两个以上的值,此时则取前进值较小的值, 如此就不会跳过可能的位置,例如texture这个关键字,t的前进值应该取后面的3而不是取前面的 7。
代码实现
//导入头文件
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
//函数声明
void table(char*);
int search(int, char*, char*);
void childstring(char*, char*, int, int);
int skip[256];
int main(){
char str_input[80]; char str_key[80];
char tmp[80] = {'\0'}; int m, n, p;
printf("请输入字串:");
gets(str_input);
printf("请输入搜寻关键字:");
gets(str_key);
m = strlen(str_input); // 计算字串长度
n = strlen(str_key); table(str_key);
p = search(n-1, str_input, str_key);
//循环比较
while(p != -1) {
childstring(str_input, tmp, p, m);
printf("%s\n", tmp);
p = search(p+n+1, str_input, str_key);
}
printf("\n"); return 0;
}
//建立前进表
void table(char *key){ int k, n;
n = strlen(key);
for(k = 0; k <= 255; k++){
skip[k] = n;
}
for(k = 0; k < n - 1; k++){
skip[key[k]] = n - k - 1;
}
}
//查找关键字
int search(int p, char* input, char* key){
int i, m, n;
char tmp[80] = {'\0'};
m = strlen(input);
n = strlen(key);
while(p < m) {
substring(input, tmp, p-n+1, p);
//比较两字符串是否相同
if(!strcmp(tmp, key)){
return p-n+1;
}
p += skip[input[p]];
}
return -1;
}
//取出子字符串
void childstring(char *text, char* tmp, int s, int e){
int i, j;
for(i = s, j = 0; i <= e; i++, j++){
mp[j] = text[i];
}
tmp[j] = '\0';
}
写在最后:
读两遍下来,如果仍然有不清楚的地方,可在评论区留言。
如果你有其他感到困惑的问题,欢迎留言。