最长公共子串问题
给出两个字符串,求这两个字符串的公共子串。(还有一个类似的问题是两字符串的公共子序列,有待分析)。
例子:
INPUT:
abcdefg
gdefacd
OUTPUT:
def
动态规划法
使用动态规划法,相当于用空间换时间。
将一个复杂的大问题,分解为较为简单的子问题,最重要的步骤就是推导状态转移公式。
现有两个字符串,X=(x1, x2, …, xm), Y=(y1, y2, …, yn)
dp[i][j]代表以x[i-1]字符为结尾和以y[j-1]字符为结尾的公共子串长度。(注意!此设定是子串的结尾必须是x[i-1]和y[j-1])。容易推导,当x[i-1] == y[j-1]时,dp[i][j] = dp[i-1][j-1] + 1,否则,dp[i][j]=0。因为假如x[i-1]字符和y[j-1]字符不相等的话,以x[i-1]字符为结尾和以y[j-1]字符为结尾的公共子串就不存在,长度为0;假如相等,最短长度也为1,若之前还存在长为L的公共子串,那么长度就为L+1。
所以状态转移公式为:
if x[i-1] == y[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
if x[i-1]!=y[j-1]:
dp[i][j] = 0
python代码:
def findLongestSubString(s1, s2):
m = len(s1)
n = len(s2)
dp = [[0 for i in range(n + 1)] for i in range(m + 1)]
mmax = 0
start = -1
for i in range(1, m+1):
for j in range(1, n+1):
if s1[i-1] == s2[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
if dp[i][j] > mmax:
mmax = dp[i][j]
start = i - mmax
return s1[start:start+mmax]