题目:
请实现一个函数用来匹配包含'. '和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但与"aa.a"和"ab*a"均不匹配。
示例 1:
- 输入:s = "aa" p = "a"
- 输出: false
- 解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
- 输入: s = "aa" p = "a*"
- 输出: true
- 解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
- 输入:s = "ab" p = ".*"
- 输出: true
- 解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
- 输入:s = "aab" p = "c*a*b"
- 输出: true
- 解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
- 输入:s = "mississippi" p = "mis*is*p*."
- 输出: false
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。
解题思路:
从s[:1]和p[:1]是否能匹配开始判断,每轮添加一个字符并判断是否能匹配,直至添加完整个字符串s和p。展开来看,假设s[:i]与p[:j}可以匹配,那么下一状态有两种:
- 添加一个字符si+1后是否能匹配?
- 添加字符pj+1后是否能匹配?
因此,本题的状态共有m*n种,应定义状态矩阵dp,dp[i][j]代表s[:i]与p[:j]是否能够匹配。做好状态定义,接下来就是根据“普通字符”、“.”、“*”三种字符的功能定义,分析出动态规划的转移方程。、
1.状态定义:设动态规划矩阵dp,dp[i][j]代表字符串s的前i个字符和p的前j个字符能否匹配;
2.转移方程:需要注意,由于dp[0][0]代表的是空字符的状态,因此dp[i][j]对应的添加字符是s[i-1]和p[j-1]。
- 当p[j-1]=‘*’时,dp[i][j]在当以下任一情况为true时等于true:
(1)dp[i][j-2]:将字符组合[p-2]*看作出现0次时,能否匹配;
(2)dp[i-1][j]且s[i-1]=p[j-2]:让字符p[j-2]多出现1次时,能否匹配;
(3)dp[i-1][j]且p[j-2]=‘.’:让字符‘.’多出现1次时,能否匹配;
- 当p[j-1]!=‘*’时,dp[i][j]在当以下任一情况为true时等于true:
(1)dp[i-1][j-1]且s[i-1]=p[j-1]:让字符p[j-1]多出现一次时,能否匹配;
(2)dp[i-1][j-1]且p[j-1]=‘.’:让字符‘.’多出现1次时,能否匹配;
3.初始化:需要先初始化dp矩阵首行,以避免状态转移时索引越界。
- dp[0][0]=true:代表两个空字符串能够匹配;
- dp[0][j]=dp[0][j-2]且p[j-1]=‘*’时:首行s为空字符串,因此当p的偶数位为*时才能够匹配(即让p的奇数位出现0次,保持p是空字符串)。因此,循环遍历字符串p,步长为2(即只看偶数位)。
4.返回值:dp矩阵右下角字符,代表字符串s和p能否匹配。
代码:
class Solution:
def isMatch(self, s: str, p: str) -> bool:
m, n = len(s) + 1, len(p) + 1
dp = [[False] * n for _ in range(m)]
dp[0][0] = True
# 初始化首行
for j in range(2, n, 2):
dp[0][j] = dp[0][j - 2] and p[j - 1] == '*'
# 状态转移
for i in range(1, m):
for j in range(1, n):
if p[j - 1] == '*':
if dp[i][j - 2]: dp[i][j] = True # 1.
elif dp[i - 1][j] and s[i - 1] == p[j - 2]: dp[i][j] = True # 2.
elif dp[i - 1][j] and p[j - 2] == '.': dp[i][j] = True # 3.
else:
if dp[i - 1][j - 1] and s[i - 1] == p[j - 1]: dp[i][j] = True # 1.
elif dp[i - 1][j - 1] and p[j - 1] == '.': dp[i][j] = True # 2.
return dp[-1][-1]
复杂度:
- 时间复杂度:O(MN),其中M,N分别为s和p的长度,状态转移需遍历整个dp矩阵
- 空间复杂度:O(MN),状态矩阵dp使用O(MN)的额外空间。