题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配。
解题思路
动态规划:自上而下的变化
class Solution {
public:
bool isMatch_i(char* s, char* p, int start_i, int start_p) {
int si = start_i, pi = start_p;
while(pi<strlen(p)) {
if(pi+1<strlen(p)&&p[pi+1]=='*'){
if(p[pi]=='*') return false;
while(si<strlen(s) && (s[si]==p[pi]||p[pi]=='.')){
if(isMatch_i(s, p, si, pi+2)) return true;
si++;
}
if(isMatch_i(s, p, si, pi+2)) return true;
return false;
}
else if (strlen(s)==si) return false;
else if (s[si]==p[pi] || p[pi]=='.') {
si++;
pi++;
}
else return false;
}
return (strlen(s)==si);
}
bool match(char* str, char* pattern) {
return isMatch_i(str, pattern, 0, 0);
}
};
动态规划:自下而上的变化
class Solution {
public:
bool match(char* str, char* pattern) {
return isMatch_i(str, pattern);
}
bool isMatch_i(char* s, char* p) {
int snum = strlen(s);
int pnum = strlen(p);
vector<vector<int> > dp(snum + 1, vector<int>(pnum + 1, false));
dp[0][0] = true;
for (int i = 2; i < pnum + 1; ++ i) {
if (p[i-1] == '*') {
dp[0][i] = dp[0][i-2];
}
}
for (int i = 1; i < snum + 1; ++ i) {
for (int j = 1; j < pnum + 1; ++ j) {
if (p[j-1] == '.') dp[i][j] = dp[i-1][j-1];
else if (p[j-1] == '*') {
dp[i][j] = ( dp[i][j-2] || // p[j-2] p[j-1] match zero
dp[i][j-1] || // p[j-2] p[j-1] match one remove *
((p[j-2] == '.' || p[j-2] == s[i-1]) && dp[i-1][j]) );// p[j-2] p[j-1] match mutil
}
else {dp[i][j] = dp[i-1][j-1] && s[i-1] == p[j-1];}
}
}
return dp[snum][pnum];
}
};
以上为LeetCode答案,为了更严谨,
首先,考虑特殊情况:
1>两个字符串都为空,返回true
2>当第一个字符串不空,而第二个字符串空了,返回false(因为这样,就无法匹配成功了,而如果第一个字符串空了,第二个字符串非空,还是可能匹配成功的,比如第二个字符串是“a*a*a*a*”,由于‘*’之前的元素可以出现0次,所以有可能匹配成功)
之后就开始匹配第一个字符,这里有两种可能:匹配成功或匹配失败。
但考虑到pattern下一个字符可能是‘*’, 这里我们分两种情况讨论:pattern下一个字符为‘*’或不为‘*’:
1>pattern下一个字符不为‘*’:这种情况比较简单,直接匹配当前字符。如果匹配成功,继续匹配下一个;如果匹配失败,直接返回false。注意这里的“匹配成功”,除了两个字符相同的情况外,还有一种情况,就是pattern的当前字符为‘.’,同时str的当前字符不为‘\0’。
2>pattern下一个字符为‘*’时,稍微复杂一些,因为‘*’可以代表0个或多个。这里把这些情况都考虑到:
a>当‘*’匹配0个字符时,str当前字符不变,pattern当前字符后移两位,跳过这个‘*’符号;
b>当‘*’匹配1个或多个时,str当前字符移向下一个,pattern当前字符不变。(这里匹配1个或多个可以看成一种情况,因为:当匹配一个时,由于str移到了下一个字符,而pattern字符不变,就回到了上边的情况a;当匹配多于一个字符时,相当于从str的下一个字符继续开始匹配)
class Solution {
public:
bool match(char* str, char* pattern) {
if(!str || !pattern) return false;
return matchCore(str, pattern);
}
bool matchCore(char* str, char* pattern) {
if(*pattern == '\0') {
if(*str == '\0') return true;
else return false;
}
if(*(pattern+1) == '*') {
if(*str == *pattern || (*str != '\0' && *pattern == '.'))
return matchCore(str+1, pattern) || matchCore(str, pattern+2);
else return matchCore(str, pattern+2);
}
if(*str == *pattern || (*str != '\0' && *pattern == '.')) return matchCore(str+1, pattern+1);
return false;
}
};