目录
其实BF算法就是在主串里面找出与子串匹配的部分,然后输出子串第一个字符在主串出现的位置
(1) BF算法简介
BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。
串的相关介绍
主串:包含子串 的串
子串:串中任意个连续的字符串组成的子序列
子串的位置:子串的第一个字符串在主串中出现的序号
其实BF算法就是在主串里面找出与子串匹配的部分,然后输出子串第一个字符在主串出现的位置
(2)BF算法演算过程
先设i=0作为主串初始化下标,j=0作为子串初始化小标
主串:"adadabbdd"
子串:"dabb"
第一次匹配:
i=0
a d a d a b b d d
j=0
d a b b
此时发现第一个字符a与d不相匹配,所以匹配失败,此时主串的下标应该从第二个字符开始匹配相应的下标回溯为 i = i - j +1 , j=0
第二次匹配
i=1
a d a d a b b d d
j=0
d a b b
此时子串的第三个字符不匹配,所以匹配失败,主串要往右移动一位,子串下标 j 要回溯到出发点 0 ,i = i - j +1 , j=0
第三次匹配
i=2
a d a d a b b d d
j=0
d a b b
同样还是第一个字符不匹配,所以再次同上操作
第四次匹配
i=3
a d a d a b b d d
j=0
d a b b
第四次匹配成功返回值为子串第一个字符在主串出现的位置,也就是返回一个 3
(3)BF算法不同情况下的复杂度
最简单的情况
设主串S有n个字符,子串T有m个字符,最简单的情况匹配到主串的第 i 个匹配成功,前面匹配了i-1次,所以总共比较匹配了i-1+m次,那么如果对于匹配成功的子串这样子的算会有n-m+1匹配总数,所以最简单的情况下平均匹配次数:
复杂度为O(n+m)
最复杂的情况
如果每次匹配到子串的最后一个才可以去确定是否匹配成功的话,那会复杂度为O(n*m)
(4)代码的实现
int bf(char* a, char* b)
{
int i, j;
i = j = 0;
while (a[i] != '\0')
{
if (a[i] == b[j] && b[j] != '\0')//当出现字符相等的时候
{
i++;//主串右移1位
j++;//子串右移一位
}
else
{
i = i - j + 1;//如果出现不相等那么主串回溯到开始匹配的下一位
j = 0;//子串回溯到0
}
if (j == strlen(b))//当子串匹配到最后一个说明匹配成功,返回子串第一个字符在主串出现的位置
{
return i - j + 1;
}
}
return -1;//如果匹配失败的话,就返回-1
}
总结:BF算法其实并不是比较好的字符串匹配算法,因为是每一个字符进行匹配的,其效率是非常低的,尤其是最复杂的情况下,效率最低,但这确实是体现了这个暴力算法的暴力特征