题目描述
请实现一个函数用来匹配包括 ‘.’ 和 ‘*’ 的正则表达式。模式中的字符 . 表示任意一个字符,而 ‘*’ 表示它前面的字符可以出现任意次(包含 0 次)。
在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 “aaa” 与模式 “a.a” 和 “ab*ac*a” 匹配,但是与 “aa.a” 和 “ab*a” 均不匹配。
思路
应该注意到,’.’ 是用来当做一个任意字符,而 ‘*’ 是用来重复前面的字符。这两个的作用不同,不能把 ‘.’ 的作用和 ‘*’ 进行类比,从而把它当成重复前面字符一次。
动态规划:
- 当S为空,P为空或者"x*y*"形式的可以匹配
- 当P为空,S为空可以匹配
- 循环扫描字符串匹配情况并记录在 dp[][] 数组
- 如果 str[i-1] == pattern[j-1] || pattern[j-1] == ‘.’, 此时dp[ i ][ j ] = dp[i-1][j-1],说明字符匹配
- 如果 pattern[j] == ‘*’:
1、如果 str[i-1] == pattern[j-2] || pattern[ j-2 ] == ‘.’
此时dp[i][j] = dp[i][j-2] // a*匹配0次,此时"*"代表空串
或者 dp[i][j] = dp[i][j-1] // a*匹配1次,
或者 dp[i][j] = dp[i-1][j] // a*匹配多次
2、 如果str[i-1] != pattern[j-2] , 此时dp[i][j] = dp[i][j-2] //a*匹配0次
代码
public boolean match(char[] str, char[] pattern)
{
int m=str.length,n=pattern.length;
//动态数组,字符串和模式中的字符都从1开始编号
boolean[][] dp=new boolean[m+1][n+1];
dp[0][0] = true; //字符串和模式首端的空字符已匹配
//s为空串
for(int i=1;i<=n;i++){
if(pattern[i-1] == '*') //i-1为pattern真实索引
dp[0][i]=dp[0][i-2]; //只有x*能匹配空串,若有*,它的真值一定和dp[0][i-2]的相同
}
//然后两层循环填充剩下的部分
for(int i=1;i<=m;i++){
for(int j=1;j<=n;j++){
if(str[i-1] == pattern[j-1] || pattern[j-1] == '.') //先从str第一个字符开始和pattern的所有字符匹配
dp[i][j]=dp[i-1][j-1];
else if(pattern[j-1] == '*') //匹配到*,分情况
if(pattern[j-2] == str[i-1] || pattern[j-2] == '.'){ //str是否和*前一个字符相等
dp[i][j] |= dp[i][j-1]; //a*匹配1次
dp[i][j] |= dp[i-1][j]; //a*匹配多次
dp[i][j] |= dp[i][j-2]; //a*匹配0次
}else //不相等,状态记录和上一个字符一样
dp[i][j] |= dp[i][j-2]; //a*匹配0次
}
}
return dp[m][n];
}