最长公共子序列
问题描述:
题解:以问题中为例:
A='helloworld'
B='loop'
res[i][j]表示:截止到B的第i个字符和截止到A的第j个字符的最长公共子序列
例如:res[2][5]=2表示第2行第5列,也就是lo和hello的最长公共子序列等于2
0 | h | e | l | l | o | w | o | r | l | d | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
l | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
o | 0 | 0 | 0 | 1 | 1 | 2 | 2 | 2 | 2 | 2 | 2 |
o | 0 | 0 | 0 | 1 | 1 | 2 | 2 | 3 | 3 | 3 | 3 |
p | 0 | 0 | 0 | 1 | 1 | 2 | 2 | 3 | 3 | 3 | 3 |
其推到公式为:
代码如下:
def lcs(s, t):
len1 = len(s)
len2 = len(t)
# 初始化一个二维数组,行数为t的大小,列数为s的大小
res = [[0 for i in range(len1 + 1)] for j in range(len2 + 1)]
for i in range(1, len2 + 1):
for j in range(1, len1 + 1):
if t[i - 1] == s[j - 1]:
res[i][j] = 1 + res[i - 1][j - 1]
else:
res[i][j] = max(res[i - 1][j], res[i][j - 1])
return res[-1][-1]
最长公共子串
问题描述:
res[i][j]表示:截止到B的第i个字符和截止到A的第j个字符的最长公共子串
和LCS问题唯一不同的地方在于当A[i] != B[j]时,res[i][j]就直接等于0了,因为子串必须连续,且res[i][j] 表示的是以A[i],B[j]截尾的公共子串的长度。因此可以根据这个方程来进行填表,以"helloworld"和“loop”为例:
0 | h | e | l | l | o | w | o | r | l | d | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
l | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 |
o | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 1 | 0 | 0 | 0 |
o | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 |
p | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
代码中需要一个变量来记录最大公共子串的数值
代码如下:
def lcs_string(s, t):
len1 = len(s)
len2 = len(t)
# 初始化一个二维数组,行数为t的大小,列数为s的大小
res = [[0 for i in range(len1 + 1)] for j in range(len2 + 1)]
# 声明一个变量,记录最大公共子串的值
max_len = 0
for i in range(1, len2 + 1):
for j in range(1, len1 + 1):
if t[i - 1] == s[j - 1]:
res[i][j] = 1 + res[i - 1][j - 1]
else:
res[i][j] = 0
max_len = max(max_len, res[i][j])
return max_len