正则表达式匹配
题目:请实现一个函数用来匹配包括’.‘和’‘的正则表达式。模式中的字符’.‘表示任意一个字符,而’'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配
思路:首先,考虑特殊情况,1.当str为空的时候,如果pattern也为空,则返回true;2.如果str不为空,而pattern为空,则怎样都不会匹配成功,返回false;3.若str为空,pattern不为空,则不好判断,如果pattern="a*a*"则返回true;
然后就可以开始匹配了。
分两种情况,考虑到下一个字符有可能是 * ,所以分两种情况:
1.当模式中第二个字符不是 * 时:
a.如果字符串第一个字符和模式中第一个字符相匹配,那么字符串和模式都后移一个字符,然后继续匹配。
b.如果字符串第一个字符与模式中第一个字符不匹配,直接返回false。
2.当模式中第二个字符时 * 时:
a.如果字符串第一个字符与模式第一个字符不匹配,则模式后移2个字符。
b.如果字符串第一个字符与模式第一个字符匹配,或者模式中第一个字符是 . ,则可以分为匹配0个或 (1个或多个)两种情况。即:
前一种情况:模式后移2个两个字符,相当于x.*被忽略
后一种情况:字符串后移1个字符,模式不变,继续匹配下一个字符。
public boolean match(char[] str, char[] pattern) {
if (str == null || pattern == null) {
return false;
}
int strIndex = 0;
int patternIndex = 0;
return matchCore(str, strIndex, pattern, patternIndex);
}
public boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
//有效性检验:str到尾,pattern到尾,匹配成功
if (strIndex == str.length && patternIndex == pattern.length) {
return true;
}
//pattern先到尾,匹配失败
if (strIndex != str.length && patternIndex == pattern.length) {
return false;
}
//模式第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) || (pattern[patternIndex] == '.' && strIndex != str.length)) {
return matchCore(str, strIndex, pattern, patternIndex + 2)//模式后移2,视为x*匹配0个字符
|| matchCore(str, strIndex + 1, pattern, patternIndex);//*匹配1个,再匹配str中的下一个
} else {
return matchCore(str, strIndex, pattern, patternIndex + 2);
}
}
//模式第2个不是*,且字符串第1个跟模式第1个匹配,则都后移1位,否则直接返回false
if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) || (pattern[patternIndex] == '.' && strIndex != str.length)) {
return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
}
return false;
}