Leetcode 10:正则表达式匹配(最详细的解法!!!)

给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.''*' 的正则表达式匹配。

'.' 匹配任意单个字符。
'*' 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串 (s) ,而不是部分字符串。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 .*

示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: '*' 代表可匹配零个或多个前面的元素, 即可以匹配 'a' 。因此, 重复 'a' 一次, 字符串可变为 "aa"。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 'c' 可以不被重复, 'a' 可以被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

解题思路

这个问题如果以暴力破解方式思考其实挺难的,主要的难点在于*匹配多少次的问题,所以我们可以先尝试通过递归解决这个问题。

对于*,我们可以从最简单的情况思考。我们首先判断len(p)>1 and p[1]=="*",如果是的话,说明*p的第二位,我们就要判断s[0]p[0]能否匹配,如果可以匹配的话,我们继续判断isMatch(s[1:], p)(也就是*匹配了一次,我们会继续使用.*或者?*去参与比较),同时需要判断isMatch(s,p[2:])是不是成立(也就是*表示匹配0次)。如果上述条件不成立,我们还需判断isMatch(s,p[2:])是不是成立(也就是*表示匹配0次),因为此时也可能匹配0次。

如果*不在p的第二位,我们就要判断s[0]p[0]能否匹配。

class Solution:
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        s_len, p_len = len(s), len(p)
        if p_len == 0:
            return s_len == 0

        if p_len > 1 and p[1] == "*":
            return self.isMatch(s, p[2:]) or \
                (s_len != 0 and (s[0] == p[0] or p[0] == '.') \
                and self.isMatch(s[1:], p))
        else:
            return s_len != 0 and (s[0] == p[0] or p[0] == '.')\
                and self.isMatch(s[1:], p[1:]) 

上面的写法使用了trick,我们将=='*'时候的两种情况归并到了一起,分开写的话如下

if p_len > 1 and p[1] == "*":
    if s_len != 0 and (s[0] == p[0] or p[0] == '.'):
        return self.isMatch(s[1:], p) or self.isMatch(s, p[2:])
    else:
    	return self.isMatch(s, p[2:])
else:
    return s_len != 0 and (s[0] == p[0] or p[0] == '.')\
        and self.isMatch(s[1:], p[1:]) 

对于递归可以解决的问题,我们都可以记忆化搜索的方式来优化。

class Solution:
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        s_len, p_len = len(s), len(p)
        mem = [[None]*(p_len+1) for _ in range(s_len+1)]
        return self._isMatch(s, p, mem)

    def _isMatch(self, s, p, mem):
        s_len, p_len = len(s), len(p)
        if p_len == 0:
            return s_len == 0
        if mem[s_len][p_len] != None:
            return mem[s_len][p_len]

        if p_len > 1 and p[1] == "*":
            mem[s_len][p_len] =  self._isMatch(s, p[2:], mem) or \
                (s_len != 0 and (s[0] == p[0] or p[0] == '.') \
                and self._isMatch(s[1:], p, mem))
            return mem[s_len][p_len]
        else:
            mem[s_len][p_len] =  s_len != 0 and (s[0] == p[0] or p[0] == '.')\
                and self._isMatch(s[1:], p[1:], mem) 
            return mem[s_len][p_len]

然而记忆化搜索又和动态规划有着密切的联系,所以我们可以非常迅速的写出动态规划转移方程

  • f ( i , j ) = f ( i − 1 , j − 1 )    i f    p [ j − 1 ] ! = ′ ∗ ′    a n d    s [ i − 1 ] = = p [ j − 1 ] ∣ ∣ p [ j − 1 ] = = ′ . ′ f(i,j)=f(i-1,j-1)\ \ if\ \ p[j-1]!='*'\ \ and \ \ s[i-1]==p[j-1]||p[j-1]=='.' f(i,j)=f(i1,j1)  if  p[j1]!=  and  s[i1]==p[j1]p[j1]==.
  • f ( i , j ) = f ( i , j − 2 )    i f    p [ j − 1 ] = = ′ ∗ ′ f(i,j)=f(i,j-2)\ \ if \ \ p[j-1]=='*' f(i,j)=f(i,j2)  if  p[j1]==
  • f ( i , j ) = f ( i − 1 , j )    a n d    ( s [ i − 1 ] = = p [ j − 2 ] ∣ ∣ p [ j − 2 ] = = ′ . ′ )    i f    p [ j − 1 ] = = ′ ∗ ′ f(i,j)=f(i-1,j)\ \ and \ \ (s[i-1]==p[j-2] || p[j-2]=='.')\ \ if\ \ p[j-1]=='*' f(i,j)=f(i1,j)  and  (s[i1]==p[j2]p[j2]==.)  if  p[j1]==

f(i,j)表示输入s[0:i]和输入p[0:j]时的匹配结果。

class Solution:
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        s_len, p_len = len(s), len(p)
        mem = [[False]*(p_len+1) for _ in range(s_len+1)]
        mem[0][0] = True
        for i in range(s_len+1):
            for j in range(1, p_len+1):
                if p[j-1] == '*':
                    mem[i][j] = j > 1 and mem[i][j-2] or \
                                (i > 0 and (s[i-1] == p[j-2] or \
                                j > 1 and p[j-2] == ".") and \
                                 i > 0 and mem[i-1][j])
                else:
                    mem[i][j] = i > 0 and \
                                mem[i-1][j-1] and \
                                ((i > 0 and s[i-1] == p[j-1]) or\
                                 p[j-1] == ".")

        return mem[-1][-1]

我在之前的一些问题中也一直提及这样的问题,如果我们拿到一个动态规划问题无从下手的时候,不防先从递归开始思考。

我将该问题的其他语言版本添加到了我的GitHub Leetcode

如有问题,希望大家指出!!!

  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
正则表达式匹配是一个经典的算法问题,主要是判断一个字符串是否能够完全匹配给定的正则表式。 在LeetCode上,也有一道关于正则表达式匹配的题目,题目编号是10。这道题目要求实现一个支持 '.' 和 '*' 的正则表达式匹配,其中 '.' 可以匹配任意单个字符,'*' 可以匹配零个或多个前面的元素。 解决这道题可以使用动态规划的思想,具体的思路如下: 1. 创建一个二维数组dp,dp[i][j]表示s的前i个字符与p的前j个字符是否匹配。 2. 初始化dp为true,表示空字符串与空正则表达式是匹配的。 3. 初始化dp[i]为false,表示非空字符串与空正则表达式是不匹配的。 4. 初始化dp[j],如果p[j-1]是"*",则dp[j]的值取决于dp[j-2]的值,表示将p[j-2]与p[j-1]去掉后的正则表达式是否匹配空字符串。 5. 对于其它的dp[i][j],分成两种情况: - 如果p[j-1]是"."或者与s[i-1]相等,则dp[i][j]的值取决于dp[i-1][j-1]的值,表示将s[i-1]和p[j-1]去掉后的字符串是否匹配。 - 如果p[j-1]是"*",则dp[i][j]的值取决于以下两种情况: - dp[i][j-2]的值,表示将p[j-2]和p[j-1]去掉后的正则表达式是否匹配s的前i个字符。 - dp[i-1][j]的值,表示将s[i-1]与p[j-2]匹配后的字符串是否匹配p的前j个字符。 6. 最后返回dp[s.length()][p.length()]的值,表示整个字符串s与正则表达式p是否完全匹配。 以上是一种使用动态规划解决正则表达式匹配问题的思路,具体的实现可以参考LeetCode官方提供的递归思路的解法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [LeetCode算法 —— 正则表达式匹配(详解官方动态规划思想)](https://blog.csdn.net/weixin_42100963/article/details/106953141)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值