算法-KMP

    KMP算法的作用在于在一个主串中查找一个主串。

传统查找子串的方法是一个字符一个字符的比较,代码如下:

 public static int notKMP(String main,String sub){

        for (int i=0;i<main.length();i++){
            int j=0;
            int k=i;
            while (main.charAt(k)==sub.charAt(j)){
                k++;
                j++;
                if (j==sub.length()){
                    return i;
                }
            }
        }
        return -1;

    }

这种方式在遇到不相同的时候,主串往下移动一位,子串恢复到0.继续的进行对比。

KMP的算法的有点在于子串中如果有相同的部分的话,那么可以省略一部分的校验,下面这个图加深一些印象:

如果我们使用KMP算法的话,那么中间的红框的那部分是不需要比较的,很显而易见,因为他们都第一步进行了比较了,当然怎么判断还是需要算法的。

算法的步骤分为两部分,第一部分是算出子串的next数组,这个数组表达的就是子串的相似度,具体算法实现:

 /**
     * 返回KMP数组
     * @param str
     * @return
     */
    public static int[] getNextArr(String str){
        int[] nexts=new int[str.length()];
        //j=1 的时候为0  j=2的时候为1
        nexts[0]=0;
        nexts[1]=1;
        for (int j=2;j<str.length();j++){
            int index=1;
            for (int i=0;i<j-1;i++){
                if(str.substring(0,i+1).equals(str.substring(j-i-1,j))){
                    index++;
                }
            }
            nexts[j]=index;
        }
        return nexts;
    }

第二部分就是进行匹配:

 /**
     *
     * @param s 主串
     * @param t 子串
     * @param pos 从主串哪个位置开始匹配
     * @return
     */
    public static int indexKMP(String s,String t,int pos){
        int i=pos;
        int j=0;
        int[] nexts=getNextArr(t);
        while (i<s.length()&&j<t.length()){
            if (j==0||s.charAt(i)==t.charAt(j)){
                i++;
                j++;
            }else {
                j=nexts[j-1];
            }
        }

        if (j>=t.length()){
           return i-t.length();
        }
        return 0;
    }

. 总的来讲就是只关注子串,出现相同的那部分可以不进行比较。

转载于:https://www.cnblogs.com/zr520/p/6596334.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BF算法KMP算法都是串的模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式串较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主串的第一个字符开始,依次和模式串的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主串的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式串与主串的匹配次数。具体来说,KMP算法通过预处理模式串,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值