题目
请实现一个函数用来匹配包含'. '
和'*'
的正则表达式。模式中的字符'.'
表示任意一个字符,而'*'
表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"
与模式"a.a"
和"ab*ac*a"
匹配,但与"aa.a"
和"ab*a"
均不匹配。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母以及字符.
和*
,无连续的'*'
。
解题思路
解法一:动态规划
我们每次从模式串 p 中取出一个字符或者“字符 + 星号”的组合,并在字符串 s 中进行匹配。对于 p 中一个字符而言,它只能在 s 中匹配一个字符,匹配的方法具有唯一性;而对于 p 中“字符 + 星号”的组合而言,它可以在 s 中匹配任意自然数个字符,并不具有唯一性。因此我们可以考虑使用动态规划,对匹配的方案进行枚举。
用 dp[i][j] 表示 s 的前 i 个字符与 p 中的前 j 个字符是否能够匹配。在进行状态转移时,我们考虑 p 的第 j 个字符的匹配情况:
- 初始化:
1.1)动态规划的边界条件为 dp[0][0] =true,即空串和空正则是可以匹配的。
1.2)非空串和空正则必不匹配,dp[1][0]=…=dp[n][0]=false。 - 如果 p[j] == s[i] :dp[i][j] = dp[i-1][j-1];
- 如果 p[j] == ‘.’ :dp[i][j] = dp[i-1][j-1];
- 如果 p[j] == ‘*’,分两种情况:
4.1)如果 p[j-1] == s[i] || p[j-1] == ‘.’ :
4.1.1)dp[i][j] = dp[i-1][j] // 匹配 s 末尾的一个字符,将该字符从 s 中丢掉,p 还可以继续进行匹配;
4.1.2)or dp[i][j] = dp[i][j-2] // “字符 + 星号”的组合没用,直接丢掉,不再进行匹配。
4.2)如果 p[j-1] != ‘.’ && p[j-1] != s[i] :dp[i][j] = dp[i][j-2] // p 中 * 前面的字符在 s 中出现0次,p直接前移2格。 - 返回结果:最终的答案即为 dp[m][n]。
复杂度分析:
时间复杂度:O(mn),其中 m 和 n 分别是字符串 s 和 p 的长度。我们需要计算出所有的状态,并且每个状态在进行转移时的时间复杂度为 O(1)。
空间复杂度:O(mn),即为存储所有状态使用的空间。
解法二:递归
- 如果是两个普通字符串进行匹配,按序遍历比较即可:if( s.charAt(i) == p.charAt(i) )
- 同样的,如果正则表达式字符串p只有一种"."一种特殊标记,依然是按序遍历比较即可 :if( s.charAt(i) == p.charAt(i) || p.charAt(i) == ‘.’ )
- 当出现 ‘*’ 这个特殊字符时需要特殊处理,当p的第i个元素的下一个元素是 ‘*’ 时会有两种情况:
3.1)i元素需要出现0次,我们就保持s不变,将p减掉两个元素,调用 isMatch。例如s:bc、p:a*bc,我们就保持s不变,减掉p的"\a*",调用 isMatch(s:bc,p:bc)。
3.2)i元素需要出现一次或更多次,先比较i元素和s的首元素,相等则保持p不变,s减掉首元素,调用 isMatch。例如s:aabb、p:a*bb,就保持p不变,减掉s的首元素,调用 isMatch(s:abb,p:a*bb)。
此时可能存在两种结果,例如s:abb、p:a*abb,会用两种方式处理:
1)按照上述 3.1 情况减去p的两个元素,调用 isMatch(s:abb,p:abb),最终导致true。
2)按照上述 3.2 情况比较i元素和s的首元素时,发现相等就会减掉s的首字符,调用 isMatch(s:bb,p:a*abb)。再按照上述 3.1 情况减去p的两个元素,调用 isMatch(s:bb,p:abb),最终导致false。
所以当遇到情况 3 出现 ‘*’ 时,要将所有的情况走一遍,看看是否存在可以匹配的情形。
代码
解法一:动态规划
class Solution {
public boolean isMatch(String s, String p) {
int m = s.length();
int n = p.length();
boolean[][] dp = new boolean[m+1][n+1]; // java中初始化全为false
// 空字符串和空正则串可以匹配,非空字符串和空正则串不匹配。
dp[0][0] = true;
for(int i=0; i<=m; i++){
for(int j=1; j<=n; j++){
// 非空正则分为两种情况:非* 和 *,注意字符串的索引比字符串的长度小1。
if(p.charAt(j-1) != '*'){
if(i >= 1 && (p.charAt(j-1) == '.' || p.charAt(j-1) == s.charAt(i-1))){
dp[i][j] = dp[i-1][j-1];
}
}else{
if(i >= 1 && (p.charAt(j-2) == s.charAt(i-1) || p.charAt(j-2) == '.')){
dp[i][j] = dp[i-1][j] || dp[i][j-2];
}else{
dp[i][j] = dp[i][j-2];
}
}
}
}
return dp[m][n];
}
}
解法二:递归
class Solution {
public boolean isMatch(String s, String p) {
if(s.length() == 0 && p.length() == 0){
return true;
}
if(s.length() != 0 && p.length() == 0){
return false;
}
// 如果p的第i个元素的下一个元素是 ‘*’ 时
if(p.length() >= 2 && p.charAt(1) == '*'){
// i元素需要出现0次,我们就保持s不变,将p减掉两个元素;
// 或者i元素需要出现一次或更多次,先比较i元素和s的首元素,相等则保持p不变,s减掉首元素
return isMatch(s, p.substring(2)) || ((!s.isEmpty() && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.')) && isMatch(s.substring(1), p));
}else{
return ((!s.isEmpty() && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.')) && isMatch(s.substring(1), p.substring(1)));
}
}
}