题目
Implement regular expression matching with support for '.'
and '*'
.
'.' Matches any single character.
'*' Matches zero or more of the preceding element.
The matching should cover the entire input string (not partial).
The function prototype should be:
bool isMatch(const char *s, const char *p)
Some examples:
isMatch("aa","a") → false
isMatch("aa","aa") → true
isMatch("aaa","aa") → false
isMatch("aa", "a*") → true
isMatch("aa", ".*") → true
isMatch("ab", ".*") → true
isMatch("aab", "c*a*b") → true
分析
实现一个简单的正则匹配,其中仅涉及.和*的正则,该题是剑指offer原题,但是剑指offer的实现方法效率不高,而且其中的一种情况其实是可以直接省略的,即当前字符与模式匹配并且模式下一个字符为*时,书上说可以(1)选择文本后移一位,模式后移两位,进入下一状态;(2)文本后移一位,模式保持不变,留在当前状态;(3)文本不变,模式后移两位,忽略当前模式。但其实情况(1)没必要单独列出,因为情况(1)相当于情况(2)递归时选择情况(3),并且从前向后匹配比从后向前匹配要慢,因此改为从后向前匹配并且忽略情况(1)。官方给出另外一种递归方法实现比较简单,但是由于频繁调用string.substr()导致效率不高,另外动态规划方法可以参考My concise recursive and DP solutions with full explanation in C++ 。
从后向前递归代码:
class Solution {
public:
bool isMatch(string s,string p,int s_s,int p_s){
if(s_s==-1&&p_s==-1)//同时到达字符串前时,表示匹配完成
return true;
if(s_s>-1&&p_s==-1)//模式先到头时,表示匹配未完成
return false;
if(p[p_s]=='*'){//模式中有*号时
if(s_s>-1&&(s[s_s]==p[p_s-1]||p[p_s-1]=='.'))//如果此时模式*前的字符与文本匹配或者模式*前字符为.则可以选择匹配成功但模式保持当前或者不匹配并且跳过当前模式,剑指offer中的匹配成功并且跳过当前模式,即当前模式仅匹配一次,实际上与匹配成功并且模式保持不变并且在下一次跳过当前模式对应,因此可以省略
return isMatch(s,p,s_s-1,p_s)||isMatch(s,p,s_s,p_s-2);
else
return isMatch(s,p,s_s,p_s-2);//如果模式*前字符与文本不匹配,则跳过当前模式
}
if(s_s>-1&&p_s>-1&&(s[s_s]==p[p_s]||p[p_s]=='.'))//如果模式此时仅为字符或者.则向前移一个元素
return isMatch(s,p,s_s-1,p_s-1);
return false;
}
bool isMatch(string s, string p) {
return isMatch(s,p,s.length()-1,p.length()-1);//从后往前进行匹配
}
};
官方简洁递归代码:
class Solution {
public:
bool isMatch(string s, string p) {
if(p.empty())
return s.empty();
bool first_match=(!s.empty())&&(p[0]==s[0]||p[0]=='.');//判断第一个元素是否能匹配
if(p.length()>=2&&p[1]=='*'){
return (isMatch(s,p.substr(2))||(first_match&&isMatch(s.substr(1),p)));//对应模式中有*时的情况,要么模式跳过,要么第一个元素匹配的话则模式保持
}
else{
return first_match&&isMatch(s.substr(1),p.substr(1));//如果第一个元素匹配则完成一次匹配
}
}
};