KMP-Java

1.KMP简介

        KMP算法(Knuth-Morris-Pratt算法)是一种用于高效地解决字符串匹配问题的算法。该算法的核心思想是通过预处理模式串(要匹配的字符串)构建一个回退表(也称为部分匹配表),以在匹配过程中避免不必要的回溯。

        KMP算法的优势在于在匹配过程中,不需要回溯到文本串中之前已经比较过的位置,因此可以避免重复比较,提高匹配效率。它的核心是根据模式串构建一个回退表(部分匹配表),该表记录了模式串每个位置匹配失败时应该回退到的位置。

        KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。

        KMP算法的时间复杂度为O(n+m),其中n是文本串的长度,m是模式串的长度。

        KMP算法在字符串匹配、子串查找、相似度计算等问题中有广泛应用,它的高效性和优越性使得它成为字符串处理的常用算法之一

2.BF(Brute Force)算法

前置条件

有两个字符串str1和str2,求str2是否是str1的子串(需连续),若是字串则返回str1中的下标,不存在返回-1.

例1. str1 ="abcd"   str2 = "abcd"  返回0

例2. str1 ="abcd"   str2 = "html"  返回-1

例3. str1 ="abcde"   str2 = "cde"  返回2

public static int strStr1(String str1, String str2) {
        if (Objects.equals(str1, "") && Objects.equals(str2, "")) {
            return 0;
        }
        if (str1 == null || str2 == null || str1.length() < str2.length()) {
            return -1;
        }
        char[] chars1 = str1.toCharArray();
        char[] chars2 = str2.toCharArray();
        for (int i = 0; i < chars1.length; i++) {
            int count = i;
            for (int j = 0; j < chars2.length; j++) {
                while (i < chars1.length && j < chars2.length && chars1[i] == chars2[j]) {
                    i++;
                    j++;
                }
                if (j == chars2.length) {
                    return i - j;
                } else {
                    i = count;
                    break;
                }
            }
        }
        return -1;
    }

3.KMP算法 

        思路:当我们发现某一个字符不匹配的时候,由于已经知道之前遍历过的字符,那能不能利用这些信息来避免暴力算法中"回退(backup)"的步骤呢?即主串中的指针一直向前移动。 KMP算法在匹配失败的时候,会去看最后一个匹配的字符它所对应的next数值,于是移动子串,直接跳过对应子串的字符

        与BF的区别:不再回退主串中的指针,只需要遍历一次主串即可

        KMP算法是在暴力算法的基础上使用的算法,就是使用了next数组进行加速,KMP的加速过程--核心next数组的生成,next数组的生成只需要模式串即可,不需要子串,那么什么是next数组?

        next数组代表了在匹配失败的时候,子串中可以跳过的匹配个数。其本质其实就是寻找子串中相同前后缀的长度【并且一定是最长的】,前后缀不能是字符串本身。

        next数组的求解,采用递推公式快速求解next数组【原因就是比BF更快】:巧妙之处,不断利用已经掌握的信息避免重复的计算

        next数组的第一个元素为0,因为一个元素不存在前后缀。

        假设我们已经知道当前的共同前后缀了,分两种情况讨论:
       1.如果下一个字符依然相同的话,那么不就构成了一个更长的前后缀吗,很明显他的长的=之前的加上1
       2.下一个字符不同,我们就看看其中存不存在更短的,其实可能与下一个字符构成共同的前后缀的,这一步难道要暴力求解吗?
     其实不同,根据之前的计算我们掌握了一个重要信息,就是子串前后这两部分是完全相同的,也就是说,右边这部分的后缀其实等于左边这部分的后缀
     那么直接在左边寻找共同的前后缀即可,而左边的前后缀之前已经计算过了,直接查表即可知道它的长度为1,于是我们又回到了最开始的步骤,检查下一个字符是否相同

public static int strStr(String str1, String str2) {
        if (Objects.equals(str1, "") && Objects.equals(str2, "")) {
            return 0;
        }
        if (str1 == null || str2 == null || str1.length() < str2.length()) {
            return -1;
        }
        char[] chars1 = str1.toCharArray();
        char[] chars2 = str2.toCharArray();
        int i = 0;//主串中的指针
        int j = 0;//子串中的指针
        while (i < chars1.length) {
            int[] nextArray = getNextArray(chars2);
            if (j < chars1.length && chars1[i] == chars2[j]) {//两字符相同
                i++;
                j++;
            } else if (j > 0) {//两字符不相同
                j = nextArray[j - 1];//如果不相同,则根据next数值跳过子串前几个字符的比较
            } else {//子串第一个字符就匹配失败
                i++;
            }
            if (j == chars2.length) {//匹配成功
                return i - j;
            }
        }
        return -1;
    }
    public static int[] getNextArray(char[] chars) {
        int[] next = new int[chars.length];
        next[0] = 0;
        int i = 1;
        int prefix = 0;//当前共同前后缀长度
        while (i < chars.length) {
            if (chars[prefix] == chars[i]) {//下一个字符相同的话,代表可可以构成一个更长的前后缀
                prefix += 1;
                next[i] = prefix;
                i++;
            } else {//下一个字符不同
                if (prefix == 0) {//如果依然不存在的话,那么设为0即可
                    next[i] = 0;
                    i++;
                } else {
                    //直接查表看看存不存在更短的前后缀,
                    prefix = next[prefix - 1];
                }
            }
        }
        return next;
    }

此方法来自于B站:最浅显易懂的 KMP 算法讲解_哔哩哔哩_bilibili

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
SQLAlchemy 是一个 SQL 工具包和对象关系映射(ORM)库,用于 Python 编程语言。它提供了一个高级的 SQL 工具和对象关系映射工具,允许开发者以 Python 类和对象的形式操作数据库,而无需编写大量的 SQL 语句。SQLAlchemy 建立在 DBAPI 之上,支持多种数据库后端,如 SQLite, MySQL, PostgreSQL 等。 SQLAlchemy 的核心功能: 对象关系映射(ORM): SQLAlchemy 允许开发者使用 Python 类来表示数据库表,使用类的实例表示表中的行。 开发者可以定义类之间的关系(如一对多、多对多),SQLAlchemy 会自动处理这些关系在数据库中的映射。 通过 ORM,开发者可以像操作 Python 对象一样操作数据库,这大大简化了数据库操作的复杂性。 表达式语言: SQLAlchemy 提供了一个丰富的 SQL 表达式语言,允许开发者以 Python 表达式的方式编写复杂的 SQL 查询。 表达式语言提供了对 SQL 语句的灵活控制,同时保持了代码的可读性和可维护性。 数据库引擎和连接池: SQLAlchemy 支持多种数据库后端,并且为每种后端提供了对应的数据库引擎。 它还提供了连接池管理功能,以优化数据库连接的创建、使用和释放。 会话管理: SQLAlchemy 使用会话(Session)来管理对象的持久化状态。 会话提供了一个工作单元(unit of work)和身份映射(identity map)的概念,使得对象的状态管理和查询更加高效。 事件系统: SQLAlchemy 提供了一个事件系统,允许开发者在 ORM 的各个生命周期阶段插入自定义的钩子函数。 这使得开发者可以在对象加载、修改、删除等操作时执行额外的逻辑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ray-国

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值