给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。
‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明:
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:
输入:
s = “aa”
p = “a”
输出:
false
解释: “a” 无法匹配 “aa” 整个字符串。
示例 2:
输入:
s = “aa”
p = “a*”
输出:
true
解释: 因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。
示例 3:
输入:
s = “ab”
p = “."
输出:
true
解释: ".” 表示可匹配零个或多个(’*’)任意字符(’.’)。
示例 4:
输入:
s = “aab”
p = “cab”
输出:
true
解释: 因为 ‘*’ 表示零个或多个,这里 ‘c’ 为 0 个, ‘a’ 被重复一次。因此可以匹配字符串 “aab”。
示例 5:
输入:
s = “mississippi”
p = “misisp*.”
输出:
false
题目解答
字符串匹配问题,存在最优子问题,即可以用动态规划;
dp[i][j]表示s字符串的前i个字符与p字符串的前j个字符是否匹配;
初始状态dp[0][0]=True ,空字符互相匹配
1.若s[i-1]==p[j-1] ,dp[i][j]=True;
2.若是s[i-1]!=p[j-1]则分情况讨论
case1 :p[j-1]=’.’,则可以忽略这一个字符,即dp[i][j]=dp[i-1][j-1]
case2 :p[j-1]=’*’,即要分类 * 的两种情况;
情况1: * 前面的字母为0个时:此时s[i-1]!=p[j-2] , dp[i][j]=dp[i][j-2] ,
代表若p[j-3]与s[i]匹配,则当前也匹配。
情况2: * 代表多个前面的字母,或前面的字母为 ’ . ’
此时s[i-1] == p[i-2] || p[i-2] == ’ . ',
dp[i][j]= dp[i-1][j] # * 看作任意个使用,等于抵消了p[i-1]这个字符
or dp[i][j]=dp[i][j-1] # * 看作一个使用
or dp[i][j]=dp[i][j-2] # *看作0个使用
Python
class Solution:
def isMatch(self, s: str, p: str) -> bool:
#动态规划,dp[i][j]保存前面的答案
dp = [[False] * (len(p) + 2) for _ in range(len(s) + 2)]
dp[0][0]=True
s='1'+s
p='1'+p
for i in range(1,len(s)+1):
for j in range(1,len(p)+1):
#遍历每一个i,j
#情况1:相同则为i
if s[i-1]==p[j-1]:
dp[i][j]=dp[i-1][j-1]
#第i个数,和第j个数
#情况2:p[j]为'.',可匹配任意字符串,故于i-1,j-1相同
if p[j-1]=='.':
dp[i][j]=dp[i-1][j-1]
#情况3:P[j]为'*',可匹配多个或0个j-1的字符串
if p[j-1]=='*':
#分类1:*前面的字母取0时
if s[i-1]!=p[j-2]:
dp[i][j]=dp[i][j-2]
#分类2:*前面的字母不取0时
if s[i-1]==p[j-2] or p[j-2]=='.':
#前面为字母或'.'
dp[i][j]=(bool(dp[i][j-1]) or bool(dp[i-1][j]) or bool(dp[i][j-2]))
#*看作单个的用 #*看作任意个数用——则当前i直接取消 #看作空的用
return dp[len(s)][len(p)]
C++
class Solution {
public:
bool isMatch(string s, string p) {
s=" "+s;//防止该案例:""\n"c*"
p=" "+p;
int m=s.size(),n=p.size();
bool dp[m+1][n+1];
memset(dp,false,(m+1)*(n+1));
dp[0][0]=true;
for(int i=1;i<=m;i++){
for(int j=1;j<=n;j++){
if(s[i-1]==p[j-1] || p[j-1]=='.'){
dp[i][j]=dp[i-1][j-1];
}
else if(p[j-1]=='*'){
if(s[i-1]!=p[j-2] && p[j-2]!='.')
dp[i][j]=dp[i][j-2];
else{
dp[i][j]=dp[i][j-1] || dp[i][j-2] || dp[i-1][j];
}
}
}
}
return dp[m][n];
}
};
DFS
*可将前一个字符变为0个或多个;
substr降低了效率;
class Solution {
public:
bool isMatch(string s, string p) {
return dfs(s,p);
}
private:
bool dfs(string s , string p){
if(p.empty()) return s.empty();
bool first_match = !s.empty() && (s[0] == p[0] || p[0]=='.');
//s不空,s开头与p开头匹配
if(p.length()>=2 && p[1] == '*'){ //p的长度大于等于2,p下一个为*
return dfs(s,p.substr(2))||(first_match&&dfs(s.substr(1),p));
//作为0个前面的 //若前一个匹配了,可作为1一个前面的
}else{
return first_match && dfs(s.substr(1),p.substr(1));
}
}
};
优化:用指针代替substr
注意点:char * 表示的字符串,其末尾为0或’\0’;
class Solution {
public:
bool isMatch(string s, string p) {
return dfs(s.c_str(),p.c_str());
}
private:
bool dfs(const char* s ,const char * p){
if(*p==0) return *s==0;
bool first_match = *s && (*s == *p || *p=='.');
//s不空,s开头与p开头匹配
if(*(p+1) == '*'){ //p的长度大于等于2,p下一个为*
return dfs(s,p+2)||(first_match&&dfs(s+1,p));
//作为0个前面的 //若前一个匹配了,可作为1一个前面的
}else{
return first_match && dfs(s+1,p+1);
}
}
};