正文模式匹配
在计算机处理的各类数据中有很大一类属于正文数据,也常称为文本型数据。这些数据由字符组成行,再由行组成正文。几乎所有对正文继续编辑的软件都提供“查找”的功能。即在正文中查询有没有和给定子串相同的子串。若存在,则将屏幕上的光标移动到这个子串的起始位置。这个操作即为串的定位操作,通常称为正文模式匹配。
代码展示如下
#include<stdio.h>
int Index_BF(char S[], char T[], int pos)
{
//若串S中,从第pos个字符起存在和串T相同的子串,则称匹配成功
//返回第一个这样的子串在串S中的位置,否则返回-1
int i = pos;
int j = 0;
while (S[i + j] != '\0'&&T[j] != '\0')
if (S[i + j] == T[j])
j++; //继续比较后一字符
else
{ //重新开始新的一轮比较
i++;
j = 0;
}
if (T[j] == '\0')
return i; //目标子串已经遍历完 匹配成功
else
return -1; //串中第pos个字符之后不存在与目标子串相同的子串
}
void main()
{
char S[] = "LXYILOVEUVERYMUCH!";
char T[] = "LOVE";
int pos = 3;
if (Index_BF(S, T, pos) != -1)
{
printf("在字符串'%s'中匹配到子串'%s',位置为%d!\n", S, T, Index_BF(S, T, pos));
}
else
printf("未匹配到目标子串!");
}
总结
该算法可以实现从主串的任意位置起查询和模式串相匹配的子串,若想找到正文中所有和模式串匹配的子串,只要多次调用该算法即可。假设该次调用返回值为 i ,则下一次调用时进行匹配的起始位置应为 pos=i+Strlength(T);
本笔记所依据的教材为严薇敏版的《数据结构及应用算法教程》
所有代码在Visual Studio 2017上均可正常运行
如有错误欢迎指出