正则表达式匹配
时间限制:1秒 空间限制:32768K 热度指数:171528
本题知识点: 字符串
算法知识视频讲解
题目描述
请实现一个函数用来匹配包括’.‘和’*‘的正则表达式。模式中的字符’.‘表示任意一个字符,而’*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配
解析
主要解决方案是回溯法,使用递归或者dp
DP 法解析
(1)划分阶段:
(2)确定状态:
dp[i][j](代表s[:i+1]和p[:j+1]是否match)
(3)边界条件:
A. dp[0][0] = True (代表两个空数组match)
B. dp[i][0] = False (代表s不为空,p为空则必然不匹配)
C. dp[0][j] = dp[0][j-2] if p[j-1]==’*’ and j>=2(代表s为空,但是j是2的倍数,且p[j-1]是
*
)
(4)状态转移方程:(分情况考虑)
一. p[j] != ‘*’ 时,dp[i][j] == True (i,j之前部分匹配) 且(s[i] 和p[j]匹配 or p[j] == .
)
dp[i+1][j+1] = dp[i][j] and (s[i] == p[j] or p[j] == ‘.’ )
二. p[j] == ‘*’ : (重点考虑该情况)
a. 该 ‘*’ match了s中的0个字符:
【注:该处(及下方)提到的match了x个字符都是就当前而言的,不考虑s及p的第i、j之后的字符match情况】
dp[i+1][j+1] = dp[i+1][j-1]
b. 该 ‘*’ match了s中的1个字符:
dp[i+1][j+1] = dp[i][j-1] and(s[i] == p[j-1] or p[j-1] == ‘.’ )
c. 该 ‘*’ match了s中的多个字符:
dp[i+1][j+1] = dp[i][j+1] and (s[i] == p[j-1] or p[j-1] == ‘.’ )
代码:DP
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
# 法1.内置函数
# return re.match('^' + p + '$', s) != None
# 法3.dp
dp = [[False] * (len(s) + 1) for _ in range(len(p) + 1)]
dp[0][0] = True
for i in range(1, len(p)):
dp[i + 1][0] = dp[i - 1][0] and p[i] == '*'
for i in range(len(p)):
for j in range(len(s)):
if p[i] == '*':
dp[i + 1][j + 1] = dp[i - 1][j + 1] or dp[i][j + 1]
if p[i - 1] == s[j] or p[i - 1] == '.':
dp[i + 1][j + 1] = dp[i + 1][j + 1] or dp[i + 1][j]
else:
dp[i + 1][j + 1] = dp[i][j] and (p[i] == s[j] or p[i] == '.')
return dp[-1][-1]
update:2019年10月9日
递归
思路:
一、当模式中的第二个字符是*
时:
A、如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
1.模式后移2字符,相当于
x*
被忽略;
2.字符串后移1字符,模式后移2字符,相当于
x*
匹配一位;
3.字符串后移1字符,模式不变,即继续匹配字符下一位,相当于
x*
匹配多位;
B、如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。
二、当模式中的第二个字符不是*
时:
A、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的部分。
B、如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回False。
代码
# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
# write code here
#如果两者都为空,则匹配成功
if (len(s) == 0 and len(pattern) == 0):
return True
#如果模式为空,字符串不为空,则匹配不成功
if (len(s) > 0 and len(pattern) == 0):
return False
if len(pattern) > 1 and pattern[1] == '*':
if s and (pattern[0] == '.' or s[0] == pattern[0]):
f1 = self.match(s[1:], pattern)#多个
f2 = self.match(s[1:], pattern[2:])#一个
f3 = self.match(s, pattern[2:])#零个
if f1 or f2 or f3:
return True
else:
return False
else:
return self.match(s, pattern[2:])
elif s and (pattern[0] == '.' or s[0] == pattern[0]):
return self.match(s[1:], pattern[1:])
#如果字符串为空,模式不为空,但模式长度等于1,或者模式长度大于1但第二个字符不为’*‘,则匹配不成功
else:
return False
链接:https://www.nowcoder.com/questionTerminal/45327ae22b7b413ea21df13ee7d6429c
转载:https://blog.csdn.net/u014265088/article/details/52574639
链接:https://www.nowcoder.com/questionTerminal/45327ae22b7b413ea21df13ee7d6429c?answerType=1&f=discussion