Leetcode原题链接:找出字符串中第一个匹配项的下标
一、暴力版
1、思路
- 简单的遍历法。
- 把不满足的条件罗列出,剩下的就是能满足的。
2、代码
class Solution:
def strStr(self, haystack: str, needle: str) -> int:
n_p = 0
haystack, needle = list(haystack), list(needle)
ret = -1
count = 0
for h_p in range(len(haystack)):
if len(haystack) - h_p < len(needle):
return -1
else:
if haystack[h_p] != needle[n_p]:
continue
else:
for i in range(len(needle)):
if haystack[h_p + i] == needle[i]:
count += 1
if count != len(needle):
count = 0
continue
else:
ret = h_p
return ret
return ret
二、KMP算法
1、思路
1.1 给模式串做一个next
列表,用来保存当前位置子串的最大前后缀相同的长度
- ①初始化
next
列表(next[0] = 0
,毕竟单个字符串没有前后缀)和j
(当前子串前缀的最后一个字符,即j = 0
),i
(当前子串后缀的最后一个字符)无需初始化,下面的循环将从i = 1
开始。 - ②遍历模式串的子串,若当前子串的
i、j
位置的字符不同,则j
退回到当前字符前一个字符对应的next
列表值的位置,即j = next[j-1]
(如果一直不同,则一直退回到模式串第一个字符的位置,即j = 0
处),赋值给当前i
位置的next
列表值为j
,即next[i] = j
。【注意此处是while
循环】 - ③最终得到长度为模式串长度的
next
列表。
1.2 借助next
列表对文本串进行逐个字符比较
- ①若当前字符不同,则
j
退回到当前字符前一个字符对应的next
列表值的位置,即j = next[j-1]
(如果一直不相同,则一直退回到模式串第一个字符的位置,即j = 0
),而后继续循环i
。【注意此处是while
循环】 - ②若当前字符相同,则
i、j
分别后移继续比对。直到j
等于模式串的长度,返回i-j+1
;或是匹配失败,退出循环,返回-1
。
2、代码
class Solution:
def strStr(self, haystack: str, needle: str) -> int:
if len(haystack) < len(needle) or len(needle) == 0:
return -1
next = self.getNext(needle)
j = 0
for i in range(len(haystack)):
while(j > 0 and haystack[i] != needle[j]):
j = next[j-1]
if haystack[i] == needle[j]:
j += 1
if j == len(needle):
return i-j+1
return -1
def getNext(self, needle):
next = [0] * len(needle)
j = 0
next[0] = 0
for i in range(1, len(needle)):
while(j > 0 and needle[j] != needle[i]):
j = next[j-1]
if needle[j] == needle[i]:
j += 1
next[i] = j
return next
三、总结
- KMP算法着实有点复杂,对于小型任务提升不显著,如下图所示,一个是暴力法,一个是KMP算法,虽然时间复杂度
O(m * n)
降到了O(m + n)
,但是时间上根本没变化hahaha。
- 大型任务应该提升会很显著,希望未来有字符串匹配类型的问题可以想得到用它。
部分内容参考代码随想录