修炼内功---数据结构与算法26---字符串匹配算法之BF算法

几个字符串匹配算法,首先从最简单的字符串匹配算法 —— BF 算法说起,BF 是 Brute Force 的缩写,中文译作暴力匹配算法,也叫朴素匹配算法。

BF 算法的原理很简单,在继续介绍之前,我们先引入两个术语:主串和模式串。
简单来说,我们要在字符串 A 中查找子串 B,那么 A 就是主串,B 就是模式串。

作为最简单、最暴力的字符串匹配算法,BF 算法的思想可以用一句话来概括,
那就是,如果主串长度为 n,模式串长度为 m,我们在主串中检查起始位置分别是 0、1、2…n-m 且长度为 m 的 n-m+1 个子串,看有没有跟模式串匹配的。图示如下:

结合上图,具体来说,就是每次拿模式串和主串对齐,然后从左到右依次比较每个字符,
如果出现不相等,则把模式串往后移一个位置,再次重复上述步骤,
直到模式串每个字符与对应主串位置字符都相等,则返回主串对应下标,表示找到,
否则返回 -1,表示没找到。

这个算法很好理解,因为这就是我们正常都能想到的暴力匹配,BF 算法的时间复杂度最差是 O(n*m),
意味着要模式串要移到主串 n-m 的位置上,并且模式串每个字符都要与子串比较。

尽管 BF 算法复杂度看起来很高,但是在日常开发中,如果主串和模式串规模不大的话,该算法依然比较常用,因为足够简单,实现起来容易,不容易出错。
另外,在规模不大的情况下,开销也可以接受,毕竟 O(n*m) 是最差的表现,大部分时候,执行效率比这个都要高。

但是对于对时间要求比较敏感,或者需要高频匹配,数据规模较大的情况下,比如编辑器中的匹配功能、敏感词匹配系统等,BF 算法就不适用了,后面我们将介绍更高级的字符串匹配算法来处理这些场景需求。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值