面试题19:正则表达式匹配
题目:请实现一个函数用来匹配包含’.‘和’*‘的正则表达式。模式中的字符’.‘表示任意一个字符,而’*'表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"模式"a.a"和"ab*ac*a"匹配,但与"aa.a"及"ab*a"均不匹配。
#include <iostream>
#include <algorithm>
#include <cmath>
#include <cstring>
using namespace std;
/**
* 分析:如果模式匹配中的字符ch是'.',那么它可以匹配字符串中的任意字符;
* 如果模式中的字符ch不是'.',而且字符串中的字符也是ch,那么它们相互匹配;
* 当模式中的第二个字符不是'*'时,问题要简单很多,
* 当模式中的第二个字符是'*'时,问题要复杂一点,因为可能有多种不同的匹配方式.
* 一种选择是在模式上向后移动两个字符。这相当于'*'和它前面的字符被忽略了;
* 也可以保持模式不变
**/
bool matchCore(char* str, char* pattern) {
if(*str=='\0' && *pattern=='\0') return true;
if(*str!='\0' && *pattern=='\0') return false;
if(*(pattern+1)=='*') {
if(*pattern==*str || (*pattern=='.' && str!='\0'))
return matchCore(str+1, pattern+2) // move on the next state
|| matchCore(str+1, pattern) // stay on the current state
|| matchCore(str, pattern+2); // ignore a '*'
else matchCore(str, pattern+2); // ignore a '*'
}
if(*str==*pattern || (*pattern=='.' && *str!='\0'))
return matchCore(str+1, pattern+1);
return false;
}
bool match(char* str, char* pattern) {
if(str==NULL || pattern==NULL) return false;
return matchCore(str, pattern);
}
int main() {
printf("%d",match("aaaaa", ".*")); // 这时候模式一直保持当前状态( matchCore(str+1, pattern) )
return 0;
}