10. 正则表达式匹配
题目介绍
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。
‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
示例 1:
输入:s = “aa”, p = “a”
输出:false
解释:“a” 无法匹配 “aa” 整个字符串。
示例 2:
输入:s = “aa”, p = “a*”
输出:true
解释:因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。
示例 3:
输入:s = “ab”, p = “."
输出:true
解释:".” 表示可匹配零个或多个(‘*’)任意字符(‘.’)。
提示:
1 <= s.length <= 20
1 <= p.length <= 30
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母,以及字符 . 和 *。
保证每次出现字符 * 时,前面都匹配到有效的字符
来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/regular-expression-matching
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
解
根据题目,使用一个while循环内一个字符一个字符的判断不可行,此题为动态规划。
d
p
[
i
,
j
]
=
{
t
r
u
e
s
[
0
−
i
]
与
p
[
0
−
j
]
匹配
f
a
l
s
e
s
[
0
−
i
]
与
p
[
0
−
j
]
不匹配
dp[i,j]= \begin{cases} true \quad s[0-i]与p[0-j]匹配\\ false \quad s[0-i]与p[0-j]不匹配 \end{cases}
dp[i,j]={trues[0−i]与p[0−j]匹配falses[0−i]与p[0−j]不匹配
对于
d
p
[
i
,
j
]
dp[i,j]
dp[i,j]的值有四种情况,分别是
p
[
j
]
=
s
[
i
]
p[j]=s[i]
p[j]=s[i],
p
[
j
]
=
′
.
′
p[j]='.'
p[j]=′.′,
p
[
j
]
=
′
∗
′
p[j]='*'
p[j]=′∗′和其他情况。
复杂的点在于当 p [ j ] = ′ ∗ ′ p[j]='*' p[j]=′∗′,即 p [ j − 1 ] p[j-1] p[j−1]可以匹配 k k k个值 s [ i − k + 1... i ] s[i-k+1...i] s[i−k+1...i], k > = 0 k>=0 k>=0,其中 p [ j − 1 ] p[j-1] p[j−1]也可能等于 ′ . ′ '.' ′.′。
d p [ i , j ] = { d p [ i − 1 , j − 1 ] p [ j ] = s [ i ] ∣ ∣ p [ j ] = ′ . ′ d p [ i − k , j − 2 ] & s [ i − k + 1... i ] = = p [ j − 1 ] p [ j ] = ′ ∗ ′ d p [ i , j − 2 ] 其它( ∗ 可以匹配 0 个元素) dp[i,j]= \begin{cases} dp[i-1,j-1] \quad p[j]=s[i] || p[j]='.'\\ dp[i-k,j-2]\&s[i-k+1...i]==p[j-1] \quad p[j]='*'\\ dp[i,j-2] \quad 其它(*可以匹配0个元素) \end{cases} dp[i,j]=⎩ ⎨ ⎧dp[i−1,j−1]p[j]=s[i]∣∣p[j]=′.′dp[i−k,j−2]&s[i−k+1...i]==p[j−1]p[j]=′∗′dp[i,j−2]其它(∗可以匹配0个元素)
具体写起来会有很多问题,主要是关于临界值的。所以加了很多额外的判断条件,显得很雍容复杂,有机会的话重写一下代码。
class Solution {
public:
bool isMatch(string s, string p) {
int i,j,k;
s = " "+s;
p = " "+p;
vector<vector<bool>> a(s.length(), vector<bool>(p.length(),false));
// 处理临界值
for(i=0;i<s.length();i++)
{
a[i][0]=false;
}
for(j=0;j<p.length();j++)
{
a[0][j]=false;
}
k=2;
while(k<p.length() && p[k]=='*') //处理p=a*b*c*.*的情况
{
a[0][k]=true;
k+=2;
}
a[0][0] = true;
for(j=1;j<p.length();j++)
{
for(i=1;i<s.length();i++)
{
if(s[i]==p[j] || p[j]=='.')
{
a[i][j] = a[i-1][j-1];
}
else if(p[j]=='*')
{
if(s[i]==p[j-1])
{
k=0;
do{
if(k>i)
{
break;
}
if(a[i-k][j-2]==true)
{
a[i][j]=true;
break;
}
k++;
}while(s[i-k+1]==s[i]);
}
else if(p[j-1]=='.')
{
k=0;
do{
if(k>i)
{
break;
}
if(a[i-k][j-2]==true)
{
a[i][j]=true;
break;
}
k++;
}while(1);
}
else{
a[i][j]=a[i][j-2];
}
}
else
{
a[i][j]=false;
}
}
}
return a[s.length()-1][p.length()-1];
}
};