KMP算法完整版 包括求next数组的算法及其优化

public class KMPDemo {
    public static void main(String[] args) {
        int substrIndexByKMP = getSubstrIndexByKMP("aabacbaabacabc".toCharArray(), "aabaca".toCharArray());
        System.out.println(substrIndexByKMP);

        int substrIndexByKMP2 = getSubstrIndexByKMP("aaaaa".toCharArray(), "ab".toCharArray());
        System.out.println(substrIndexByKMP2);
    }

    /**
     * 比如 str="aabacbaabacabc" patten="aabaca"
     * @param str
     * @param pattern
     @return pattern在str中第一次出现的位置,返回其第一次字符出现的index下标
      * 注意:返回-1表示没有找到符合要求的字串
      * 设str.length=m,pattern.length=n
      *  最坏时间复杂度:o(m+n)
      *  其中处理求next数组的时间复杂度为o(n),循环匹配的时间复杂度为o(m)
      *  循环匹配的时间复杂度为o(m),这是因为str上的指针从来不回溯,虽然有极少情况下不会进行i++
      *  但总体而言时间复杂度为o(m) 好吧,这里还是不是很理解,先放一放
     */
    public static int getSubstrIndexByKMP(char[] str,char[] pattern){
        //先得到nextVal数组
        int[] nextValArr = getNextValArr(pattern);
        int i=0,j=0;
        while(i < str.length && j < pattern.length){
            if (j==-1 || str[i] == pattern[j]){
                //一般如果比较字符不相等,i是不用动的,只需要j移动即可
                //但是如果j==0,即子串的第一位就不匹配,则需要同时移动i和j,因此next[0]统一规定为-1,方便处理
                i++;
                j++;
            }else{
                j=nextValArr[j];
            }
        }

        if (j >= pattern.length){
            return i-pattern.length;
        }

        return -1;
    }

    /**
     * nextVal是对next的优化
     * @param pattern
     * @return
     */
    public static int[] getNextValArr(char[] pattern){
        int[] next = getNextArr(pattern);
        int[] nextVal = new int[next.length];
        nextVal[0] = -1;
        for (int i = 1; i < pattern.length; i++) {
            if (pattern[i] == pattern[next[i]]){
                //这里之所以用nextVal[next[i]]而非next[next[i]],
                // 是因为pattern[next[i]]和pattern[next[next[i]]]还可能相等,
                // 但pattern[nextVal[next[i]]]和pattern[nextVal[i]]却不可能相等,
                // 因为如果相等,i在更小的时候走到这里的时候就会再往前取一个值了
                nextVal[i] = nextVal[next[i]];
            }else {
                nextVal[i] = next[i];
            }
        }
        return nextVal;
    }

    /**
     * 关键是得到next数组
     * 参考 https://www.bilibili.com/video/BV16X4y137qw/?spm_id_from=333.337.search-card.all.click
     * @param pattern
     * @return
     */
    private static int[] getNextArr(char[] pattern) {
        int[] next = new int[pattern.length];
        next[0] = -1;
        int i=0,j=-1;
        while(i<pattern.length - 1){
            if (j==-1 || pattern[i] == pattern[j]){
                next[++i] = ++j;
            }else {
                j = next[j];
            }
        }
        return next;
    }
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值