【LEETCODE】28-Implement strStr()

Implement strStr().

Returns the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack.


参考:

http://blog.csdn.net/hcbbt/article/details/44099749

http://www.cnblogs.com/zuoyuan/p/3698900.html


KMP算法详解

http://blog.csdn.net/joylnwang/article/details/6778316


题意:

在字符串haystack中找needle,

如果存在,则返回第一次出现的起始位置

如果不存在,则返回-1


思路:

参考:

rolling hash 算法

http://blog.csdn.net/yanghua_kobe/article/details/8914970

Rolling Hash(Rabin-Karp 算法)匹配字符串与anagram串

http://blog.csdn.net/yanghua_kobe/article/details/8914970

http://courses.csail.mit.edu/6.006/spring11/rec/rec06.pdf


例如在S中找P:

S=[4,8,9,0,2,1,0,7]  

P=[9,0,2,1,0] 


移动窗口开始匹配:

S0=[4,8,9,0,2] 

S1=[8,9,0,2,1]  

S2=[9,0,2,1,0]  


每次的窗口计算的hash值与needle的hash值做比较

h(P)=90210mod m


其中移动窗口的简单方式为:去掉最高位-》尾部加上后续一位

h(S0)= 48902    mod m

h(S1)=   89021  mod m

从48902开始,去除第一位得到8902,乘以10得到89020,然后加上下一位数值得到:89021

即:


更通用的表示:

hash函数如下:


则:


h:si为从4开始数5个作用后的函数值

h:s(i+1)为从8开始数5个作用后的函数值


class Solution:  
    # @param haystack, a string  
    # @param needle, a string  
    # @return an integer  
    def strStr(self, haystack, needle):  
        hlen, nlen = len(haystack), len(needle)                    #haystack=‘aabbaa’,needle=‘bb’
        if nlen == 0:  
            return 0  
        if nlen > hlen or hlen == 0:  
            return -1  
  
        rolling = lambda x, y: x * 26 + y                           #基是26
        get_hash = lambda ch: ord(ch) - ord('a')                    #将字母转化成数字:ch='b',与‘a’的距离
  
        nhash = reduce(rolling, map(get_hash, needle))              #map将needle整体转换成数字串
                                                                    #rolling为两步间的关系
                                                                    #reduce将map得到的串通过rolling的关系完成两两迭代
                                                                    #最终得到:k1*26^(n-1)+k2*26^(n-2)+...+kn*1
        hhash = reduce(rolling, map(get_hash, haystack[:nlen]))     
        if nhash == hhash:                                          #先check首尾的nlen个字符是否就是needle
            return 0  
  
        high_base = 26 ** (nlen - 1)                                #最高位的基数位
        
        for i in range(nlen, hlen):                                 #上面check完nlen之前的了,所以直接从此处开始check后面的每个i
            hhash -= get_hash(haystack[i - nlen]) * high_base       #移除最高位  
            hhash = rolling(hhash, get_hash(haystack[i]))           #加上后续一位
            if nhash == hhash:                                      #如果得到的hash值与needle的hash值相等,说明是needle
                return i - nlen + 1                                 #因此时i已经到此小窗口尾部,所以起始位置为 i - nlen + 1
  
        return -1






LeetCode-Editor是一种在线编码工具,它提供了一个用户友好的界面编写和运行代码。在使用LeetCode-Editor时,有时候会出现乱码的问题。 乱码的原因可能是由于编码格式不兼容或者编码错误导致的。在这种情况下,我们可以尝试以下几种解决方法: 1. 检查文件编码格式:首先,我们可以检查所编辑的文件的编码格式。通常来说,常用的编码格式有UTF-8和ASCII等。我们可以将编码格式更改为正确的格式。在LeetCode-Editor中,可以通过界面设置或编辑器设置来更改编码格式。 2. 使用正确的字符集:如果乱码是由于使用了不同的字符集导致的,我们可以尝试更改使用正确的字符集。常见的字符集如Unicode或者UTF-8等。在LeetCode-Editor中,可以在编辑器中选择正确的字符集。 3. 使用合适的编辑器:有时候,乱码问题可能与LeetCode-Editor自身相关。我们可以尝试使用其他编码工具,如Text Editor、Sublime Text或者IDE,看是否能够解决乱码问题。 4. 查找特殊字符:如果乱码问题只出现在某些特殊字符上,我们可以尝试找到并替换这些字符。通过仔细检查代码,我们可以找到导致乱码的特定字符,并进行修正或替换。 总之,解决LeetCode-Editor乱码问题的方法有很多。根据具体情况,我们可以尝试更改文件编码格式、使用正确的字符集、更换编辑器或者查找并替换特殊字符等方法来解决这个问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值