KMP算法详解

程序员代码面试指南(左程云)读书笔记
 第九章
KMP算法详解
(今天听力左程云老师在牛客网上的课,讲的其中一个就是kmp,所以决定把这个过程记下来,巩固学习。)
题目:
给定两个字符串str和match,长度分别为N和M。实现一个算法,如果字符串str中含有子串match,则返回match在str中的开始位置,不含则返回-1;
举例:
str="acbc", match="bc" 返回2
str="acbc" , match="bcc" 返回-1
要求:
如果match的长度大于str的长度(M》N),str必然不会含有match,可以直接返回-1.但是如果N>=M,要求时间复杂度为O(N)
解答:
这个题重点介绍一下KMP算法,该算法是由Donald Knuth,Vaughan Pratt和James H.Morris于1977年联合发明。
首先我们来看一下这个题的普通解法:
从左到右遍历str的每一个字符,然后看如果以当前字符作为第一个字符出发是否匹配match。比如:str="aaaaaaaaaaaaaaaaaaaaaaaaaaaaaab",match="aaaab"。从str[0]出发开始匹配,匹配到str[4]=“a”时发现和match[4]=“b”不匹配,匹配失败。继续从str[1]="a"开始匹配,匹配到str[5]="a"时发现和match[4]="b"不匹配,匹配失败。继续匹配。。。。直到匹配成功。这个方法的时间复杂度为O(N*M).
之所以时间复杂度为O(N*M)是因为每次遍历到一个字符时,只要发现不匹配,就要从头开始。之前的遍历检查不能优化当前的遍历。

KMP算法优化过程:
1,首先生成match字符串的nextArr数组,这个数字的长度与match字符串的长度一样。nextArr[i]的含义是在match[i]之前的字符串match[0.....i-1]中,必须以match[i-1]结尾的后缀子串(不能包含match[0])与必须以match[0]开头的前缀子串(不能包含match[i-1])最大匹配长度是多少。这个长度就是nextArr[i]的值。
例如:
match="aaaab"字符串 nextArr[4]的值该是多少呢? match[4]="b",所以它之前的字符串为“aaa”,根据定义,这个字符串的后缀子串和前缀子串最大匹配为“aaa”。也就是当后缀子串等于match[1.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值