正则表达式匹配
题目:
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。示例 1:
输入:s = “aa” p = “a”
输出:false
解释:“a” 无法匹配 “aa” 整个字符串。
示例 2:输入:s = “aa” p = “a*”
输出:true
解释:因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。
示例 3:输入:s = “ab” p = “."
输出:true
解释:".” 表示可匹配零个或多个(’*’)任意字符(’.’)。
示例 4:输入:s = “aab” p = “cab”
输出:true
解释:因为 ‘*’ 表示零个或多个,这里 ‘c’ 为 0 个, ‘a’ 被重复一次。因此可以匹配字符串 “aab”。
示例 5:输入:s = “mississippi” p = “misisp*.”
输出:false提示:
1 <= s.length <= 20
1 <= p.length <= 30
s 只含小写英文字母。
p 只含小写英文字母,以及字符 . 和 *。
保证每次出现字符 * 时,前面都匹配到有效的字符
第一次看见这种题目,我真是无从下手,后面看见题解和其他博主的解答,我似乎懂了。
判断一个长串是否匹配模式串要基于已有的子串是否匹配模式子串,那么我们知道这是一道动态规划的题目。
常见的动态规划分为两种,一种是一维数组动态规划,第二种是二维数组动态规划,很明显这是第二种(因为有模式串和匹配字符串两种字符)。
首先,我们创建一个二维dp数组,用来存储模式子串与匹配字符串的匹配结果。
假设我们现在有匹配字符串s和模式串p。
//m为匹配字符串的长度
int m=s.length();
//n为模式子串的长度
int n=p.length();
//dp为存储匹配字符串与模式子串的匹配结果
boolean [][] dp=new boolean[m+1][n+1];
//dp[0][0]代表 s以第0个字符结尾的字符子串 与 p以第0个字符结尾的字符子串 的匹配结果
dp[0][0]=true;
现在我们已经创好了需要创建的数据结构,接下来看看算法的实现
//以行优先遍历 这里匹配字符串从第0个开始,模式串从第一个开始
for(int i=0;i<=m;i++)
{
for(int j=1;j<=n;j++)
{
//如果当前遍历的p的字符为*号
if(p.charAt(j-1)=='*')
{
//如果当前字符为*,因为*前面的一个字符是可以是0个,因此可以先让dp[i][j-2]的结果赋值给dp[i][j]
//然后再考虑另外一种情况
dp[i][j]=dp[i][j-2];
//j-1也就是p串中*前面的一个字符是否与s当前字符匹配
if(matches(s,p,i,j-1))
{
//这一句话我真是绕了好久,其实也就是dp[i][j]的结果由两个因素决定
//一是匹配*前一个字符为0个的情况
//例如 b和ba* dp[i][j]=dp[i][j-2] 也就是*与b的匹配结果可以等于b与b的匹配结果
//二是匹配字符串前一个字符与模式串当前字符的匹配情况
//例如 baa和ba* dp[i][j]=dp[i-1][j] 也就是*与第二个a的匹配结果为*与第一个a匹配的结果
//如果是baaa和ba* 也是一样的处理。
dp[i][j]=dp[i][j]||dp[i-1][j];
}
}else
{
//如果模式串当前字符不等于* 那就需要匹配s串当前字符是否等于p串当前字符
if(matches(s,p,i,j))
{
//如果当前字符匹配成功,那么dp[i][j]的匹配结果取决于s串和p串的前一个字符的匹配结果
dp[i][j]=dp[i-1][j-1];
}
}
}
}
matches字符匹配函数
//matches函数 s为匹配字符串,p代表模式串,i代表匹配字符串当前匹配字符的位序,j为模式串当前匹配字符的位序。
//matches函数用来判断s的第i个字符与p的第j个字符是否匹配,匹配成功返回true失败,返回false。
public boolean matches(String s,String p,int i,int j)
{
//如果匹配字符串第0个字符与模式串任意字符匹配,直接返回false
if(i==0)
{
return false;
}
//如果模式串当前字符为‘.’时直接返回true
if(p.charAt(j-1)=='.')
{
return true;
}
//如果s第i个字符和p第j个字符匹配成功,则返回true
return s.charAt(i-1)==p.charAt(j-1);
}
最后返回dp值
//返回 s串以第m个字符结尾的字符子串 与 p串以第n个字符结尾的字符子串的匹配结果
return dp[m][n];
上面是leetcode官方题解的代码,我加以了自己的解释
主要过程就是首先看模式串中是否有’*‘字符,如果有,先将’*'前面的字符默认看成0个,取当前匹配结果。
然后再解决’*'匹配前一字符重复问题。
如果不含’*'号,则是正常字符匹配问题,如果当前s串字符与当前p串字符匹配成功,则需要看s串与p串前面的匹配结果。
最后返回最终结果。