自符串正则表达式匹配
问题
请实现一个函数用来匹配包括’.‘和’'的正则表达式。
模式中的字符’.'表示任意一个字符,
而’ * '表示它前面的字符可以出现任意次(包含0次)。
在本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配
解题思路
当模式中的第二个字符不是
*
时:
1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
2、如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。而当模式中的第二个字符是
*
时:如果字符串跟模式的第一个字符不匹配,则模式后移2个字符,继续匹配;
如果字符串跟模式的第一个字符匹配,可以有3种匹配方式:
1、模式后移2字符,相当于 x*被忽略;(匹配0)
2、字符串后移1字符,模式后移2字符,x *相当于只匹配一个字符;(匹配1)
3、字符串后移1字符,模式不变,即继续匹配字符下一位,因为 *可以匹配多位(匹配大于1);
可以用递归解决这种问题。
递归;拆分解决问题
代码
package C字符串;
/**
* @Author Zhou jian
* @Date 2020 ${month} 2020/2/1 0001 21:10
*
* 请实现一个函数用来匹配包括'.'和'*'的正则表达式。
* 模式中的字符'.'表示任意一个字符,
* 而'*'表示它前面的字符可以出现任意次(包含0次)。
* 在本题中,匹配是指字符串的所有字符匹配整个模式。
* 例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
*/
public class Problem1 {
public static void main(String[] args) {
char[] str = {'a','a','a'};
char[] pattern = {'a','b','*','a','c','*','a'};
System.out.println(Problem1.match(str,pattern));
}
/**
* @param str 待匹配字符串
* @param pattern 匹配模式
* @return
*
* 请实现一个函数用来匹配包括'.'和'*'的正则表达式。
* 模式中的字符'.'表示任意一个字符,
* 而'*'表示它前面的字符可以出现任意次(包含0次)。
* 在本题中,匹配是指字符串的所有字符匹配整个模式。
* 例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹 配
*/
public static boolean match(char[] str, char[] pattern) {
if (str == null || pattern == null) {
return false;
}
//字符数组起始索引
int strIndex = 0;
//匹配模式的起始索引
int patternIndex = 0;
//
return matchCore(str, strIndex, pattern, patternIndex);
}
/**
*
* @param str : 匹配的字符
* @param strIndex 匹配的字符起始索引
* @param pattern 模式字符数组
* @param patternIndex 模式字符数组的起始索引
* @return
*/
public static boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
//有效性检验:str到尾,pattern到尾,匹配成功
if (strIndex == str.length && patternIndex == pattern.length) {
return true;
}
//pattern先到尾,匹配失败
if (strIndex != str.length && patternIndex == pattern.length) {
return false;
}
//模式第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
//字符串第一个跟模式第一个匹配 (这种是.*的情况)
if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) || (pattern[patternIndex] == '.' && strIndex != str.length)) {
return matchCore(str, strIndex, pattern, patternIndex + 2)//模式后移2,视为x*匹配0个字符
|| matchCore(str, strIndex + 1, pattern, patternIndex + 2)//视为模式匹配1个字符
|| matchCore(str, strIndex + 1, pattern, patternIndex);//*匹配1个,再匹配str中的下一个
} else {
return matchCore(str, strIndex, pattern, patternIndex + 2); // 当前字母无法匹配的情况,所以也视为匹配了0次
}
}
//模式第2个不是*,且字符串第1个跟模式第1个匹配,则都后移1位,否则直接返回false
if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) || (pattern[patternIndex] == '.' && strIndex != str.length)) {
return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
}
return false;
}
}