给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明:
示例 1:
示例 2:
示例 3:
示例 4:
示例 5:
动态规划解法:
题目中的匹配是一个「逐步匹配」的过程:我们每次从字符串 p 中取出一个字符或者「字符 + 星号」的组合,并在 s 中进行匹配。对于 p 中一个字符而言,它只能在 s 中匹配一个字符,匹配的方法具有唯一性;而对于 p 中字符 + 星号的组合而言,它可以在 s 中匹配任意自然数个字符,并不具有唯一性。因此我们可以考虑使用动态规划,对匹配的方案进行枚举。
我们用 f[i][j] 表示 s 的前 i 个字符与 p 中的前 j 个字符是否能够匹配。在进行状态转移时,我们考虑 p 的第 j 个字符的匹配情况:
- 如果 p 的第 j 个字符是一个小写字母,那么我们必须在 s 中匹配一个相同的小写字母,即
也就是说,如果 s 的第 i 个字符与 p 的第 j 个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。
- 如果 p 的第 j 个字符是
*
,那么就表示我们可以对 p 的第 j-1 个字符匹配任意自然数次。
字母 + 星号的组合在匹配的过程中,本质上只会有两种情况:
- 匹配 s 末尾的一个字符,将该字符扔掉,而该组合还可以继续进行匹配;
- 不匹配字符,将该组合扔掉,不再进行匹配。
如果按照这个角度进行思考,我们可以写出很精巧的状态转移方程:
- 在任意情况下,只要 p[j] 是
.
,那么 p[j] 一定成功匹配 s 中的任意一个小写字母。
最终的状态转移方程如下:
其中 matches(x, y) 判断两个字符是否匹配的辅助函数。只有当 y 是 . 或者 x 和 y 本身相同时,这两个字符才会匹配。
细节:动态规划的边界条件为 f[0][0]=true,即两个空字符串是可以匹配的。最终的答案即为 f[m][n],其中 m 和 n 分别是字符串 s 和 p 的长度。由于大部分语言中,字符串的字符下标是从 0 开始的,因此在实现上面的状态转移方程时,需要注意状态中每一维下标与实际字符下标的对应关系。
代码如下(c++):
class Solution {
public:
bool isMatch(string s, string p) {
int m = s.size();
int n = p.size();
auto matches = [&](int i, int j) {
if (i == 0) {
return false;
}
if (p[j - 1] == '.') {
return true;
}
return s[i - 1] == p[j - 1];
};
//auto就是创建临时函数bai以方便重复调用,这个一般在局部函数中使用,不暴露在外部的。auto被定义为自动推断变量的类型。[](){}; 是在定义一个函数,
//[]中括号里可以用&修饰,具体什么作用可以查查资料,我也不太清楚,在大部分情况下&符号不加也没关系,但有时编译器无法隐式捕获;
//()小括号中是形参列表;{}括号中是函数体,因为是定义函数,大括号后面记得加 ; 分号。
vector<vector<int>> f(m + 1, vector<int>(n + 1));
f[0][0] = true;
for (int i = 0; i <= m; ++i) {
for (int j = 1; j <= n; ++j) {
if (p[j - 1] == '*') {
f[i][j] |= f[i][j - 2];
if (matches(i, j - 1)) {
f[i][j] |= f[i - 1][j];
}
}
else {
if (matches(i, j)) {
f[i][j] |= f[i - 1][j - 1];
}
}
}
}
return f[m][n];
}
};
另一种版本:
class Solution {
public:
bool isMatch(string s, string p) {
vector<vector<int>> dp(s.size()+1,vector<int>(p.size()+1,0));
dp[s.size()][p.size()]=1;
for(int i=s.size();i>=0;--i){
for(int j=p.size()-1;j>=0;--j){
bool first_match=i<s.size()&&(s[i]==p[j]||p[j]=='.');
if(j<p.size()-1&&p[j+1]=='*'){
dp[i][j]=(first_match&&(dp[i+1][j]||dp[i][j+2]))||(!first_match&&(dp[i][j+2]));
}
else{
dp[i][j]=first_match&&dp[i+1][j+1];
}
}
}
return dp[0][0];
}
};