题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
分析
主要思想就是字符的第一个字符和模式第一个字符相匹配,那么字符串和模式都向后移动一个字符继续匹配;出现不匹配时直接返回false。但是当第二个字符是'*'时,比较复杂。
具体来说:
当模式中的第二个字符不是“*”时:
a1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
a2、如果 字符串第一个字符和模式中的第一个字符不匹配,直接返回false。
而当模式中的第二个字符是“*”时,比较复杂:
c1、如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符(只能当做匹配了0位的情况),继续递归。
c2、如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
b1、模式后移2字符,相当于*匹配0位;
b2、字符串后移1字符,模式后移2字符,相当于*匹配1位;
b3、字符串后移1字符,模式不变,即继续匹配字符下一位,相当于*匹配多位;
---------------------
代码及注释
public class Solution {
public boolean match(char[] str, char[] pattern){
if(str==null||pattern==null) return false;//都为null时也false???
return matchCore(str,0,pattern,0);//递归体中s和p为指针,初始化0
}
//递归体部分的处理,考虑了全部的情况:
//1.两个字符串指针都到了末尾,则true
//2.模式串到了末尾,字符串还有剩余,则false
//3.模式串下一位为*,字符串不管有没有到结尾,都先处理*的问题,处理完了再递归
//4.模式串的下一位不是*,但字符串到了结尾,则一定false
//5.模式串的下一位不是*但是.,字符串也还有剩余,则移位之后递归
//6.模式串余下的一位不是*也不是.,是普通字符:
//6.1两个字符一致,则移位之后递归
//6.2两个字符不一致,则false
public boolean matchCore(char[] str,int s, char[] pattern,int p) {
if(str.length<=s&&pattern.length<=p)
return true;//都到了最后一位,肯定true
if(str.length>s&&pattern.length<=p)
return false;//模式到了末尾,字符串还有,那肯定false
if(p+1<pattern.length&&pattern[p+1]=='*'){
//模式串下一位为*,字符串结束,模式串在*后面可能还有别的内容,不一定是true
if(s>=str.length) return matchCore(str, s, pattern, p+2);
//模式串下一位为*,字符串未结束,分为两种情况:
//1.当前字符匹配或者为.,则当前位置匹配完成,可以移位继续递归了
//字符串移1,模式串移2(匹配了1位);字符串移1,模式串不变(匹配了多位,每次移1);字符串不变,模式串移2(匹配了0位);
//此时这三种只要有一种匹配就可以
//2.当前字符不匹配,则只有匹配了0位的可能,于是字符串不变,模式串移2
else{
if(pattern[p]==str[s]||pattern[p]=='.'){
return matchCore(str,s+1, pattern,p+2)||matchCore(str,s+1, pattern,p)||matchCore(str,s, pattern,p+2);
}else{
return matchCore(str, s, pattern, p+2);
}
}
}
//当前pattern的下一个不是*时候,分为字符串结束,字符串匹配,字符串不匹配三种情况分别处理
if(s>=str.length){
return false;
}
else{
if(str[s]==pattern[p]||pattern[p]=='.'){
return matchCore(str, s+1, pattern, p+1);
}
}
return false;
}
}
注意,在移位的过程中,最后的位置会是指针S指到了字符串的最后一位之后,这时候s==str.length,指针溢出,直接return。但是程序中用的都是s>=str.length这样子,是为了移2位出错的保险起见,其实效果是一样的。