【原创】字符串匹配的三种场景及其解法

本文讲解字符串匹配相关算法。
字符串匹配就是给定两个字符串集合A和B,求A和B是否匹配。具体来说,如果集合A、B都只包含一个字符串(即字符串A和字符串B),则是一对一匹配场景,要解决的问题是字符串B是否是字符串A的子串(与子序列区别);如果集合A包含多个字符串,集合B只包含一个字符串(即字符串B),则是一对多匹配场景,要解决的问题是字符串B是否出现在集合A中(是否是A的元素);如果集合A和集合B都包含多个字符串,则是多对多匹配场景,要解决的问题是集合A、B的交集有多少。

一对一匹配

一对一匹配经典的解法是KMP算法。KMP算法的核心思想是利用字符串B本身的结构关系来减少计算量,使得一旦遇到与A中某个字符不匹配时,可以不从头匹配。所以首先要计算字符串B的最大前缀后缀匹配(保存为next数组),然后再去快速匹配字符串A。
首先计算字符串B的next数组。next数组的长度与B的长度相同,且均从0开始索引,next[i]的值表示子串B[0,1,…,i]的后缀与其前缀的最大匹配值(即子串B[0,1,…,i]最多有多少前缀和其后缀相同)。
计算时,利用动态规划的思想,假设next[i-1]已知,即子串B[0,1,…,i-1]的最大匹配后缀前缀已知,为next[i-1]个,则:如果B[i] = B[next[i-1]],则next[i] = next[i-1]+1,如果B[i] != B[next[i-1]],此时next[i]必定小于next[i-1]+1(即子串B[0,1,…i]的最大匹配前缀后缀可能有ne

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值