题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配:
思路:自顶向下分析问题,自底向上求解问题。使用递归方法,需要想清楚,1.终止条件 2.分解为子问题的时候调用自身。 每比较完一个字符和对应的pattern,我就调用函数自身去比较待比较的子串和待比较的pattern。什么情况下返回True,当待比较的s和待比较的pattern都为空时,说明比完了前面也都对得上。而当待比较的s不为空,但是pattern却已经空了,那么就返回False。当pattern下一个字符不为*并且当前字符也匹配不上时返回False。具体来说:
1>两个字符串都为空,返回true
2>当第一个字符串不空,而第二个字符串空了,返回false(因为这样,就无法匹配成功了,而如果第一个字符串空了,第二个字符串非空,还是可能匹配成功的,比如第二个字符串是“a*a*a*a*”,由于‘*’之前的元素可以出现0次,所以有可能匹配成功)之后就开始匹配第一个字符,这里有两种可能:匹配成功或匹配失败。但考虑到pattern下一个字符可能是‘*’, 这里我们分两种情况讨论:pattern下一个字符为‘*’或不为‘*’:
1>pattern下一个字符不为‘*’:这种情况比较简单,直接匹配当前字符。如果匹配成功,继续匹配下一个;如果匹配失败,直接返回false。注意这里的“匹配成功”,除了两个字符相同的情况外,还有一种情况,就是pattern的当前字符为‘.’,同时str的当前字符不为空。
2>pattern下一个字符为‘*’时,稍微复杂一些,因为‘*’可以代表0个或多个。这里把这些情况都考虑到:
a>当‘*’匹配0个字符时,str当前字符不变,pattern当前字符后移两位,跳过这个‘*’符号;
b>当‘*’匹配1个或多个时,str当前字符移向下一个,pattern当前字符不变。(这里匹配1个或多个可以看成一种情况,因为:当匹配一个时,由于str移到了下一个字符,而pattern字符不变,就回到了上边的情况a;当匹配多于一个字符时,相当于从str的下一个字符继续开始匹配)
递归求解Python代码如下:
# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
# write code here
if len(s)==0 and len(pattern)==0:
return True
if len(s)>0 and len(pattern)==0:
return False
if len(pattern)>1 and pattern[1]=='*': #pattern的下一个字符是*
if len(s)>0 and (pattern[0]==s[0] or pattern[0]=='.'):
return self.match(s[1:],pattern) or self.match(s[1:],pattern[2:])or self.match(s,pattern[2:]) #当前字符出现多个可配,当前字符只有一个可配,当前字符虽然能配上但是并不一定要匹配
else:#s为空 或者 s不为空但是pattern[0]!=s[0]!='.',或者二者都为空
return self.match(s,pattern[2:]) #没有配上
else:#pattern的下一个字符不是*
if len(s)>0 and (pattern[0]==s[0] or pattern[0]=='.'): #如果s有字符,并且还能匹配上,就接着匹配
return (self.match(s[1:],pattern[1:]))
else:#s为空或者没匹配上
return False
注意,上述代码中return三部分or的那里,or的第三部分对应这类情况:当s为"bbbba",pattern为".*a*a"时,s中最后一个a是能够和a*中的a匹配上的,但是pattern再往后还有一个不能省略的a,一旦前面匹配上那么后面就将匹配失败。因此or self.match(s,pattern[2:])对应的就是这种虽然能够匹配上,但我不一定要匹配你的情况。
递归求解的能力还是得好好培养一下,fighting!