28. 实现 strStr() (medium)
-
if use KMP, this is a HARD problem.
-
暂时看不懂kmp, 先放一放。跟着芒果冰的模版先过一遍,先让这两题ac。
-
先把java版本转换成python版本,如下:
class Solution:
def strStr(self, haystack: str, needle: str) -> int:
if needle == "" or haystack == "":
return 0
base = 131
n = len(haystack)
h = [0] * (n+1)
p = [0] * (n+1)
p[0] = 1
for i in range(1,n+1):
h[i] = h[i-1] * base + ord(haystack[i-1])
p[i] = p[i-1] * base
hash = 0
for i in range(len(needle)):
hash = hash * base + ord(needle[i])
for i in range(1, n-len(needle)+1+1):
Hash = h[i+len(needle)-1] - h[i-1] * p[len(needle)]
if Hash == hash:
return i-1
return -1
-
个人理解(不一定对,后续会继续更新...):
- KMP & 字符串哈希_是饿梦啊的博客-CSDN博客
- 字符串哈希实际上就是将一个字符串映射成一个数字,这样就可以通过这个数字来定位唯一字符串,且每次询问都是O(1)的复杂度。
- Remark:这里的哈希(hash)并不是密码学里的hash函数比如sha256(), 由于之前研究过密码学的一点内容,所以第一反应就跟这个联系起来,但是思路是一样的,利用同一字符串唯一哈希值来定位。因此这里本意是转化成数字,那么在python中可以用 ord() 来实现
- base是一个经验值,是一个质数,减少碰撞的可能性。
- 如果出现碰撞,那么就进行两次哈希,大概率没问题。
- 没有继续使用取模操作,是因为(from 芒果冰)
- “Java如果超过最大值会自己取模的, c++好像是需要手动取模一下,python也有自己的大数处理“,所以不需要进行取模。
- 待补...