前言
本文介绍了 LeetCode 第 10 题 , “Regular Expression Matching”, 也就是 “正则表达式匹配” 的问题.
本文使用 C# 语言完成题目,介绍了3种方法供大家参考,分别为 分段匹配法,回溯法,动态规划法。
题目
English
LeetCode 10. Regular Expression Matching
Given an input string (s) and a pattern ( p ), implement regular expression matching with support for ‘.’ and ‘*’.
'.' Matches any single character.
'*' Matches zero or more of the preceding element.
The matching should cover the entire input string (not partial).
Note:
s could be empty and contains only lowercase letters a-z.
p could be empty and contains only lowercase letters a-z, and characters like . or *.
Example 1:
Input:
s = "aa"
p = "a"
Output: false
Explanation: "a" does not match the entire string "aa".
Example 2:
Input:
s = "aa"
p = "a*"
Output: true
Explanation: '*' means zero or more of the preceding element, 'a'. Therefore, by repeating 'a' once, it becomes "aa".
Example 3:
Input:
s = "ab"
p = ".*"
Output: true
Explanation: ".*" means "zero or more (*) of any character (.)".
Example 4:
Input:
s = "aab"
p = "c*a*b"
Output: true
Explanation: c can be repeated 0 times, a can be repeated 1 time. Therefore, it matches "aab".
Example 5:
Input:
s = "mississippi"
p = "mis*is*p*."
Output: false
中文
LeetCode 10. 正则表达式匹配
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明:
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
解决方案
本文给出了三种解决方法。
第一种方法 是 分段匹配法。通过分析题意,我们可以把任何一个 给定的 p字符串 分割为 “尾星串” 和“无星串”的组合,然后依次匹配即可。
第二种方法 是 回溯法。
第三种方法 是 动态规划法。
下文将依次详细讲述以上三种方法。
方法一:分段匹配法
根据题意,我们可以引出以下两个概念:
1. **无星串**:若 p 中不含有“*”符号,则称之为无星串。比如p="aa.b.c"是无星串,p="a..a..a."是无星串,p="a"是无星串, p=".a"是无星串。而 p="a*b" 不是无星串,因为它包含了星号。
2. **"尾星串"**: 若p以 "*" 结尾,则称之为尾星串。 比如 p="ab*"是尾星串,p=".*"是尾星串,p="aaa*"是尾星串。 而 p="a*b" 不是尾星串,因为它不以星号结尾; p="ab" 也不是尾星串,因为它没有星号,没法以星号结尾。
根据题意以及上面2个定义,我们可以得出这样的结论:
题目给定的任何一个p字符串,都可以被 从左向右 按照星号位置 分割 为 “尾星串” 和 “无星串” 。 其中 尾星串的数量可以为0个或者1个或者多个,而无星串的数量至多为1个。
拿题目给定的5个