暴力匹配与KMP算法

本文探讨了暴力匹配方法在处理大量数据时的效率问题,并介绍了KMP算法作为解决方案。KMP算法在匹配失败时,父字符串可以选择停留或不回溯,子字符串选择性回溯,通过部分匹配值优化了回溯过程,降低了时间复杂度至O(m+n)。
摘要由CSDN通过智能技术生成

如题:给出一个父子字符串,要求匹配出父字符串中的子字符串

如:
	已知father = "BuYaoYongBaoLi", son="BaoLi",
	请问Str1是否包含Str2,若满足则返回Str2,若不满足则返回-1

如果没有学过数据结构,这样的题第一想法便是循环每个字符进行匹配,也就是俗称的暴力匹配:

i,j分别位父,子字符串的索引值

  • 每次比对失败i,j都无条件回溯,i回溯至上次比对处加1,j回溯至起点
  • 时间复杂度T(n) = O(m*n)
while (i < father.length()&&j < son.length()) {
            if (father.charAt(i) == son.charAt(j)) {
                i++;j++;
            }else {
                i = i - j + 1;
                j = 0;
            }
            if (j == son.length()){
                System.out.println("完成匹配");
                break;
            }
        }

这种算法的缺点便是每当匹配失败,父字符串就得回溯到上次失败的下一个字符,子字符串就得回溯到起点,这样虽然简单粗暴,但如果字符串是一段非常庞大的数据时,这样的匹配方案会非常浪费时间。

那么相应解决的方案就是:KMP算法
首先先介绍一个点:
在这里插入图片描述
那么依旧带入上题:
i,j分别位父,子字符串的索引值

  • 每次比对失败i 停留或不回溯j 选择性回溯
  • 父字符串若对比不涉及部分匹配值即j=0,则不回溯即i=i+1;否则则仍从上次比对失败处开始比对即 i=i
  • 若索引 j 之前字符串部分匹配值=0则回溯至起点即 j=0,否则回溯至部分匹配值后一位索引即 j=部分匹配值(索引从0开始)(注意是j之前的部分匹配值!!!)
  • 时间复杂度T(n) = O(m+n)(实现next数组n,循环遍历m)

用代码实现时注意一个点:那就是子字符串回溯的量用一个数组记录,而这个数组的实现,通过部分匹配值来确定。

  /**
     * KMP算法,i不回溯,j根据next数组进行回溯
     * 
     * @param father
     * @param son
     */
     static public void KMP(String father,String son){
        Integer[] next = next(son);
        for (int i = 0,j=0; i < father.length(); i++) {
            if (father.charAt(i) == son.charAt(j)) {
                j++;
                if (j == son.length()){
                    System.out.println("匹配成功");
                    break;
                }
            }else if (j==0){
                if ( i == father.length()-1){
                    System.out.println("匹配失败");
                }
                j = next[j];
            }else {
                i--;
                j = next[j-1];
            }
        }

    }

    /**
     * next方法获取部分匹配值,
     *
     * @param son
     * @return 子字符串的所有部分匹配值,组成一个数组
     */
    static public Integer[] next(String son){
        Integer[] next = new Integer[son.length()];
        int j = 0 ;
        next[0] = 0;
        for (int i = 1; i < son.length(); i++) {
            if (son.charAt(j)!=son.charAt(i)) {
                j = 0;
                if(son.charAt(j)==son.charAt(i)){
                    next[i] = j+1;
                    j++;
                }else {
                    next[i] = 0;
                }
            }else {
                next[i] = j+1;
                j++;
            }
        }
        return next;
    }
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值