题目描述
剑指 Offer 19. 正则表达式匹配
难度困难
请实现一个函数用来匹配包含'. '
和'*'
的正则表达式。模式中的字符'.'
表示任意一个字符,而'*'
表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"
与模式"a.a"
和"ab*ac*a"
匹配,但与"aa.a"
和"ab*a"
均不匹配。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母以及字符.
和*
,无连续的'*'
。
注意:本题与主站 10 题相同:https://leetcode-cn.com/problems/regular-expression-matching/
测试用例
- 功能测试(模式字符串里包含普通字符、‘.’、‘*’;模式字符串和输入字符串匹配/不匹配;“.*”这个组合真的是吃屎)
- 特殊输入测试(输入字符串和模式字符是null、空字符串)
题目考点
- 考察应聘者对字符串的编程能力
- 考察应聘者对正则表达式的理解
- 考察应聘者思维的全面性。在应聘者写完代码之后,面试官会要求他测试自己的代码,这个时候应聘者要充分考虑普通字符、‘.’、‘*’三者的排列组合,尽量完备地想出所有可能的测试用例。
解题思路
用递归的思想解决,对于一次判断有以下情况:
-
当模式中的第二个字符不是“*”时:
- 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
- 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
-
当模式中的第二个字符是“*”时:
- 如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。
- 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
- 模式后移2字符,相当于x*被忽略;
- 字符串后移1字符,模式后移2字符;
- 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;
参考解题
/**
* 正则表达式匹配
*
*/
public class Solution {
/**
* 正则表达式匹配
* (递归)
*
* @param str
* @param pattern
* @return
*/
public boolean match(char[] str, char[] pattern) {
if (str == null || pattern == null) {
return false;
}
return matchCore(str, pattern, 0, 0);
}
/**
* 正则表达式匹配分步
*
* @param str 字符串
* @param pattern 模式
* @param i str的下标
* @param j patter的下标
* @return
*/
public boolean matchCore(char[] str, char[] pattern, int i, int j) {
// 终止条件
if (i == str.length && j == pattern.length) {
return true;
}
// 当模式不足以配置字符串时
if (i < str.length