字符串匹配算法

最新推荐文章于 2019-02-17 22:37:22 发布

Peggy_Chang

最新推荐文章于 2019-02-17 22:37:22 发布

阅读量336

点赞数

分类专栏：算法与数据结构

本文链接：https://blog.csdn.net/Peggy_Chang/article/details/54020448

版权

32 篇文章 1 订阅

订阅专栏

主要根据《算法导论》总结了以下几种字符串匹配算法

1  n=T.length
2  m=P.length
3  for s=0 to s=n-m
4      if P[1...m]=T[s+1...s+m]
5          printf "patterns occur with shift" s

说明：

第3-5的for循环考察每一个可能的偏移，第4行用于确定当前偏移是否有效，隐藏了一个循环，用于逐个监测对应位置上的字符。

算法复杂度分析：

最坏情况下，朴素匹配算法运行时间为 $\Theta((n-m+1)m)$ ，由于不需要预处理，朴素字符串匹配算法运行时间即为其匹配时间。

相较于KMP算法，朴素算法的效率不高，因为即使有无效偏移存在时，它也只关心一个有效偏移，而完全忽略了检测无效s值时获得的文本信息。

算法思路已经很清晰地在这两份资料中展现了，下面一个问题是next数组以及nextval数组。

next[j]=k:
k是模式中第j个字符与文本中相应的字符“失配”时，在模式中重新和主串中该字符进行比较的字符的位置。

nextval[j]:
nextval[1]=0, 看第j字符和第next[j]字符是否相等，若相等，则nextval[j]=nextval[next[j]];若不等，则nextval[j]=next[j]

说明：在我的版本中j是从1开始的，有些资料是从0开始的。

关注

专栏目录