题目描述
- 请实现一个函数用来匹配包括’.’和’‘的正则表达式。模式中的字符’.’表示任意一个字符,而’‘表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配
- 地址: 牛客链接
问题分析
- 这题的难点在于如何处理 * 的情况
- 先从递归尝试,递归函数 match(str, pattern, sIndex, pIndex) 表示 str[pIndex ~ str.length - 1] 能否匹配 pattern[pIndex ~ pattern.length - 1]。这样依靠递归便完成了问题规模的缩小
- 那么如何寻求递归关系呢?
- 根据pIndex +1 位置上是否为 ‘*’ 来分类
- 如果 pIndex 为pattern最后位置,或者 pIndex + 1 位置上不是 ‘*’,那么当前只需比较 s[sIndex] 是否能匹配 p[pIndex] (当然,比较前先对sIndex判断是否越界)。只有满足当前位置字符能匹配,并且后序字符也能匹配时(递归),从当前位置开始的后序字符才算匹配。例如 abc 与 abc 的匹配,abc 与 *bc 的匹配
sIndex != s.length && (s[sIndex] == p[pIndex] || p[pIndex] == '.') && match(s, p, sIndex + 1, pIndex + 1)
- 如果pIndex + 1 位置上是 ‘’,那么需要考虑str中从sIndex开始后连续的多个字符与 pattern[pIndex] 相匹配的情况,例如 a*bb 与 aaaab 的匹配。所以需要用循环来枚举 带来的所有可能性,例如 a* 可以与 a,aa,aaa,aaaa匹配,对上述枚举的结果都要进行递归,一旦发现一个匹配的上,便停止枚举。否则一直到指针指向str末尾或者指向不匹配的字符b为止。 但有要注意的一点是,例如对于 a*aaa 与 aaa,可能pIndex位置匹配成功,但是我们有可能不要,*之前的字符 ‘a’ 出现0次才能匹配的上。
int i = sIndex;
while (i != s.length && (s[i] == p[pIndex] || p[pIndex] == '.')) {
if (m