正则表达式匹配(动态规划)
"""
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1: 输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2: 输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3: 输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4: 输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
解题思路: 按照动态规划的标准流程解题。
状态定义:
设动态规划网格 dp, dp[i][j] ,dp[i][j] 代表字符串 s 中前 i个字符和 p 中前 j个字符是否匹配,值为 true 或false
记 s 第 i个字符记为 s[m] == s[i - 1];p 第 j 个字符记为 p[n] == p[j - 1]
记 s 和 p 长度分别为 ls,lp
初始状态:
初始化第一行:dp[0][j] = dp[0][j - 2] and p[j - 1] == '*';
Tips: p 第 jj 个字符记为 '*'且 dp[0][j - 2]dp[0][j−2] 为 True
转移方程:
当第 p[n]p[n] 为 '*'时:
当 p[n-1]p[n−1] 为 '.'或 s[m] == p[n-1] 时: dp[i][j] = dp[i-1][j]
Tips: 此两种情况代表 s[m]和 p[n-1]可以匹配,等价于无 s[m]的状态 dp[i-1][j]
否则: dp[i][j] = dp[i][j-2]
Tips: 此情况代表 s[m]和 p[n-1] 无法匹配,p[n-1] p[n]的组合必须出现 0 次,等价于没有p[n−1] p[n]时的状态 dp[i][j-2]
否则,当 p[n]为 '.'或 s[m] == p[n] 时: dp[i][j] = dp[i-1][j-1]
Tips: 此情况代表 s[m]和 p[n]直接匹配,当前状态等价于未匹配此两字符前的状态 dp[i-1][j-1]
返回值:
字符串 s 中前 ls个字符和 p 中前 lp个字符是否匹配,即:dp[ls][lp]
复杂度分析:
时间复杂度 O(MN) 设 M, N分别为 s,p 长度,即为填充整个动态规划网格 dp 所需时间。
空间复杂度 O(MN)动态规划网格 dp占用 O(MN) 的额外空间。
def isMatch(self, s: str, p: str) -> bool:
ls, lp = len(s), len(p)
# 构造一个 (lp+1) * (ls+1) 的 False矩阵
dp = [[False for _ in range(lp + 1)] for _ in range(ls + 1)]
dp[0][0] = True
for j in range(2, lp + 1):
dp[0][j] = dp[0][j - 2] and p[j - 1] == '*'
for i in range(1, ls + 1):
for j in range(1, lp + 1):
m, n = i - 1, j - 1
if p[n] == '*':
if s[m] == p[n - 1] or p[n - 1] == '.':
dp[i][j] = dp[i][j - 2] or dp[i - 1][j]
else:
dp[i][j] = dp[i][j - 2]
elif s[m] == p[n] or p[n] == '.':
dp[i][j] = dp[i - 1][j - 1]
return dp[-1][-1]