一、题目描述
给你一个字符串
s
和一个字符规律p
,请你来实现一个支持'.'
和'*'
的正则表达式匹配。
'.'
匹配任意单个字符'*'
匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串
s
的,而不是部分字符串。示例 1:
输入:s = "aa", p = "a" 输出:false 解释:"a" 无法匹配 "aa" 整个字符串。示例 2:
输入:s = "aa", p = "a*" 输出:true 解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。示例 3:
输入:s = "ab", p = ".*" 输出:true 解释:".*" 表示可匹配零个或多个('*')任意字符('.')。提示:
1 <= s.length <= 20
1 <= p.length <= 20
s
只包含从a-z
的小写字母。p
只包含从a-z
的小写字母,以及字符.
和*
。- 保证每次出现字符
*
时,前面都匹配到有效的字符
二、解法(动态规划)
算法思路:
1、状态表示
dp[i][j] 表示: p 字符串 [0, j] 区间内的子串能否匹配字符串 s 的 [0, i] 区间内的子串。
2、状态转移方程
根据 最后一个位置的元素 ,结合题目要求,分情况讨论:
(1) 当 s[i] == p[j] 或 p[j] == '.' 的时候,此时两个字符串匹配上了当前的一个字符,只能从
dp[i - 1][j - 1] 中看当前字符前面的两个子串是否匹配。只能继承上个状态中的匹配结果,即
dp[i][j] = dp[i-1][j - 1] ;
(2)当 p[j] == '*' 的时候,和“通配符匹配”一题稍有不同的是,通配符匹配这一题中 "*" 本身便可匹配 0 ~ n 个字符,但此题是要带着 p[j - 1] 的字符一起,匹配 0 ~ n 个和 p[j - 1] 相同的字符。此时,匹配策略有两种选择:
- 一种选择是:p[j - 1]* 匹配空字符串,此时相当于这两个字符都匹配了一个寂寞,直接继承状态 dp[i][j - 2] ,此时 dp[i][j] = dp[i][j - 2] ;
- 另一种选择是:p[j - 1]* 向前匹配 1 ~ n 个字符,直至匹配上整个 s 串。此时相当于从 dp[k][j - 2] (0 <= k <= i) 中所有匹配情况中,选择性继承可以成功的情况。此时 dp[i][j] = dp[k][j - 2] (0 <= k <= i-1且 s[k]~s[i] = p[j - 1]或者p[j-1] == '.') ;
(3) 当 p[j] 不是特殊字符,且不与 s[i] 相等时,无法匹配。
优化:当我们发现,计算一个状态的时候,需要一个循环才能搞定的时候,我们要想到去优化。
优化的方向就是用一个或者两个状态来表示这一堆的状态。通常就是把它写下来,然后用数学的方式 做一下等价替换:当 p[j] == '*' 时,状态转移方程为:dp[i][j] = dp[i][j - 2] || dp[i - 1][j - 2] || dp[i - 2][j - 2] ......
我们发现 i 是有规律的减小的,因此我们去看看 dp[i - 1][j] :
dp[i - 1][j] = dp[i - 1][j - 2] || dp[i - 2][j - 2] || dp[i - 3][j - 2] ......
可以发现, dp[i][j] 的状态转移方程里面除了第一项以外,其余的都可以用dp[i - 1][j] 替代。因此, 当 p[j] == '*' 时, 我们优化我们的状态转移方程为: dp[i][j] = dp[i][j - 2] || (p[j-1] == '.' || p[j-1] == s[i]) &&dp[i - 1][j] 。
3、初始化
为了方便初始化,我们给dp数组增加一行、一列(第一行、第一列).将整个数组初始化为false 。(创建的布尔数组,默认初始值就为false)
由于需要用到前一行和前一列的状态,我们初始化第一行、第一列即可。
- dp[0][0] 表示两个空串能否匹配,答案是显然的, 初始化为 true 。
- 第一行表示 s 是一个空串, p 串和空串只有一种匹配可能,即 p 串表示为 "任一字符 + *",此时也相当于空串匹配上空串。所以,我们可以遍历 p 串,把所有前导为 "任一字符 + *" 的 p 子串和空串的 dp 值设为 true 。
- 第一列表示 p 是一个空串,不可能匹配上 s 串,跟随数组初始化(false)即可。
4、 填表顺序
从上往下填每一行,每一行从左往右。
5、返回值
根据状态表示,返回 dp[m][n] 的值。
三、代码
class Solution {
public boolean isMatch(String s, String p) {
int m = s.length();
int n = p.length();
//创建dp表
boolean[][] dp = new boolean[m+1][n+1];
//为了对应下标映射
s = " " + s;
p = " " + p;
//初始化
dp[0][0] = true;
for(int j = 2; j <= n; j += 2) {
if(p.charAt(j) == '*') {
dp[0][j] = true;
} else {
break;
}
}
//填表
for(int i = 1; i <= m; i++) {
for(int j = 1; j <= n; j++) {
if(p.charAt(j) == s.charAt(i) || p.charAt(j) == '.') {
dp[i][j] = dp[i-1][j-1];
}else if(p.charAt(j) == '*') {
dp[i][j] = dp[i][j-2] || (p.charAt(j-1) == '.' || p.charAt(j-1) == s.charAt(i)) && dp[i-1][j];
}
}
}
return dp[m][n];
}
}