10. 正则表达式匹配
给你一个字符串 s
和一个字符规律 p
,请你来实现一个支持 '.'
和 '*'
的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s
的,而不是部分字符串。
说明:
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母,以及字符.
和*
。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
这题确实有难度,思考了很久都没有思路。应该是一道比较复杂的动态规划,但由于 “ .* ” 格式的存在,又让我想到了递归来实现。动态规划我是真的不擅长,状态转移方程找不出来···有点绝望。
写着写着给我整笑了,直接用java的正则匹配:
class Solution {
public boolean isMatch(String s, String p) {
return s.matches(p);
}
}
竟然过了你敢信,我服了。。。。。。。。。
想了一天····最后用动态规划解决了。算法如下:
第一步:首先需要一个二维dp数组,dp[i] [j] 。dp[i] [j]表示的是 串 s 的前 i 长度 与串 p 的前 j 长度是否匹配。当 i = j = 0 时,代表两个都是空串的时候,此时 dp[0] [0]应该等于1。(0 <= i <= len(s),0 <= j <= len(s))
第二步:处理 s 为空串 ,匹配 串 p 的情况。此时,如果当前 p[j-1] 不为 ‘*’,则 dp[0] [j] = 0;否则,因为 * 可以取 0 这个值,这就表示p[j-1]的前一位即p[j-2]不管是什么,都不会影响到j-2长度的 p 串 与 s串(空串)的匹配,即当前匹配结果 p[0] [j] =p[0] [j-2]。
第三步:不断增加 s 串 的长度 ,来判断 p 串是否匹配。在这个过程中:
1、当前两个字符 s[i-1] 等于 p[j-1] 或者 p[j-1] 等于 ’ . ‘。那么 dp[i] [j] = dp[i-1] [j-1]。即 s 的前 i 长度 与串 p 的前 j 长度的匹配结果 跟 s 的前 i-1 长度 与串 p 的前 j-1 长度的匹配结果是一致的,因为当前两个字符匹配,所以不影响前面匹配结果。
2、如果 p[j-1] 等于 ’ * ’ ,分为两种情况:
第一种:* 的上一个字符 与 当前 s[i -1] 不能匹配,即p[j-2] 不等于 s[i -1] 也不等于 ’ . ‘。这时 * 可以取 0 ,则 s 的前 i 长度 与串 p 的前 j 长度的匹配结果 与 s 的前 i 长度 与串 p 的前 j-2 长度的匹配结果是一致的,即dp[i] [j] = dp[i] [j-2]。
第二种:* 的上一个字符 与 当前 s[i -1] 能匹配,即p[j-2] 等于 s[i -1] 或者等于 ’ . ‘ 。 这时 * 可以取 0 或者 1 (每次尝试只匹配一个),取 1 就表示 替换成了 一个 s[i-1] 字符,含义为则 s 的前 i 长度 与串 p 的前 j 长度的匹配结果 与 s 的前 i-1 长度 与串 p 的前 j 长度的匹配结果是一致的。取 0 时同上一种情况。而且只要0,1有一种可以匹配 即可以匹配,综上可得 dp[i] [j] 等于 dp[i] [j-2] 或者 dp[i-1] [j]
下面是代码实现,为python版本:
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
dp = [[0 for i in range(len(p)+1)] for j in range(len(s)+1)] #初始化dp数组 全置0
dp[0][0] = 1 #s,p都是空串的情况,匹配。
for j in range(1,len(p)+1):
if p[j-1] == '*':
dp[0][j] = dp[0][j-2]
for i in range(1,len(s)+1): # 当前 s 串长度 i(从前往后依次)
for j in range(1,len(p)+1): #对于 i 长度的 s 串 ,不断增加串 p 的长度,来判断是否可以匹配
if s[i-1] == p[j-1] or p[j-1] == '.':
dp[i][j] = dp[i-1][j-1]
elif p[j-1] == '*':
if p[j-2] == s[i-1] or p[j-2] == '.':
dp[i][j] = dp[i][j-2] or dp[i-1][j]
else:
dp[i][j] = dp[i][j-2]
if dp[len(s)][len(p)] == 0:
return False
return True
整了一天 ,脑子疼。真特么难理解。