正则表达式匹配
描述
请实现一个函数用来匹配包括".“和” * "的正则表达式。模式中的字符’.‘表示任意一个字符,而’ * '表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配
数据范围:
1.str 可能为空,且只包含从 a-z 的小写字母。
2.pattern 可能为空,且只包含从 a-z 的小写字母以及字符" . “和” * “,无连续的” * "。
3. 0 <= str.length <= 20
4. 0 <= pattern.length <= 30
要求:空间复杂度 O(1),时间复杂度 O(n)
分析
这个题目的难点在于出现了星号匹配的问题,这使得这个问题变的比较复杂,仔细思考会发现,这个题目使用动态规划的思路还是比较适合的.
使用动态规划的难点在于转移方程的确立
1.首先我们定义一个f[i][j]的状态转移方程,其中i 表示str中的第i个字符;j表示pattern中的第j个字符,然后判断是否匹配。
2. 接着我们需要判断两种情况
(2.1)第一种是当i、j指向的字符是同一个字母/点号(".")的时候,我们只需要判断对应位置的字符是否相同,相同则转移状态去判断子问题f[i-1][j-1]是否匹配.
此时可以得到状态转移方程的第一部分:
当
s
t
r
[
i
]
=
=
p
a
t
t
e
r
n
[
j
]
str[i] == pattern[j]
str[i]==pattern[j]时,
f
[
i
]
[
j
]
=
f
[
i
−
1
]
[
j
−
1
]
f[i][j] = f[i - 1][j-1]
f[i][j]=f[i−1][j−1];其他情况
f
[
i
]
[
j
]
=
F
a
l
s
e
f[i][j] = False
f[i][j]=False
(2.2)然后当 pattern[j] 为" * "的时候 ,可以把星号前的字符和星号看作一个整体,然后有两种子问题的情况
第一种匹配完后,继续使用,此时的转移方程是
f
[
i
]
[
j
]
=
f
[
i
−
1
]
[
j
]
f[i][j] = f[i - 1][j]
f[i][j]=f[i−1][j]
第二种就是匹配完后,就舍弃,此时的转移方程是
f
[
i
]
[
j
]
=
f
[
i
]
[
j
−
2
]
f[i][j] = f[i][j-2]
f[i][j]=f[i][j−2]
代码
class Solution:
def match(self , str , pattern ):
m, n = len(str), len(pattern) # 分别找到str和pattern的长度
def matches(i, j): #定义一个转移方程函数
if i == 0: #首先考虑一种特殊情况: str为空;
#否则第一种是当i、j指向的字符是同一个字母/点号(".")的时候,我们只需要判断对应位置的字符是否相同,
#相同则转移状态去判断子问题f[i-1][j-1]是否匹配
return False
if pattern[j - 1] == '.':
return True
return str[i - 1] == pattern[j - 1]
f = [[False] * (n + 1) for _ in range(m + 1)]
f[0][0] = True #动态规划的边界条件为f[0][0]=true,即两个空字符串是可以匹配的
for i in range(m + 1):
for j in range(1, n + 1):
#判断当j 指向 * 号的时候两种情况:
if pattern[j - 1] == '*':
f[i][j] |= f[i][j - 2]
if matches(i, j - 1):
f[i][j] |= f[i - 1][j]
else:
if matches(i, j):
f[i][j] |= f[i - 1][j - 1]
return f[m][n]