每日一道算法面试题(13):leecode10 正则表达式匹配

1.算法题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

说明:

s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:

输入:

s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

2.算法思路

算法思路:

  1. 回溯算法:如果没有 ‘*’ ,问题会很简单——只需要从左到右检查匹配
    串 s 是否能匹配模式串 p 的每一个字符。当模式串 p 中有星号时,我们需要检查匹配串 s 中的不同后缀,以判断它们是否能匹配模式串 p 剩余的部分。一个直观的解法就是用回溯的方法来体现这种关系。如果模式串中有星号,它会出现在第二个位置,即 p[1] 。这种情况下,我们可以直接忽略模式串中这一部分,或者删除匹配串的第一个字符,前提是它能够匹配模式串当前位置字符,即 p[0] 。如果两种操作中有任何一种使得剩下的字符串能匹配,那么初始时,匹配串和模式串就可以被匹配。该算法时间复杂度比较高,而且与两个字符串的长度以及长度次方关联,不是一个理想的算法;
  2. 动态规划:正则表达式匹配时匹配串 p 其实也是模式串 s 的最优子结构,可以考虑把中间结果保存起来,通过用 dp(i, j, text, pattern) 表示 text[i:] 和 pattern[j:] 是否能匹配。进而可以用更短的字符串匹配问题来表示原来的问题。

3.算法代码

算法代码:

    /**
     * leecode10:正则表达式匹配
     * @param s
     * @param p
     * @return
     */
    public static boolean isMatch(String s, String p) {
        // 初始化匹配结果数组长度
        memo = new Result[s.length() + 1][p.length() + 1];
        return dp(0, 0, s, p);
    }
    
    // 定义枚举常量
    enum Result {
        TRUE, FALSE
    }
    
    // 保存匹配的结果
    static Result[][] memo;

    public static boolean dp(int i, int j, String text, String pattern) {
        if (memo[i][j] != null) {
            return memo[i][j] == Result.TRUE;
        }
        boolean ans;
        if (j == pattern.length()){
            ans = i == text.length();
        } else{
            // 判断当前的第一个字符是否匹配
            boolean first_match = (i < text.length() &&
                    (pattern.charAt(j) == text.charAt(i) ||
                            pattern.charAt(j) == '.'));

            if (j + 1 < pattern.length() && pattern.charAt(j+1) == '*'){ // 匹配"a*" 时分两种场景:1.不考虑当前是否匹配到“a*”,直接匹配 p后面的字符串;2.保留当前的匹配,若当前字符匹配,则继续匹配 s 后面的字符串
                ans = dp(i, j+2, text, pattern) ||
                        first_match && dp(i+1, j, text, pattern);
            } else { // 正常匹配场景
                ans = first_match && dp(i+1, j+1, text, pattern);
            }
        }
        memo[i][j] = ans ? Result.TRUE : Result.FALSE;
        return ans;
    }

如果你有疑问或更好的算法思路,欢迎留言交流!!!

©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页