1、最长公共子序列
LCS 问题,即最长公共子序列问题。它并不要求所求得的字符在所给定的字符串中是连续的。比如输入的两个字符串是 ABCBDAB 和 BDCABA,那么,BCBA 和 BDAB 都是他们最长的公共子序列。则输出它们的长度 4。
假设两个字符串 A = [A0,A1....Am],,B = [B0,B1...Bn] 的最长公共子序列是 C = [C0,C1.....Ck]。下面分三种情况进行讨论:
(1)如果 Am =Bn,肯定有 Ck=Am =Bn,,也就是说,它们最后一个字符是相同的,换言之,[A0,A1....Am-1] 与 [B0,B1...Bn-1] 的公共子序列长度 + 1 = [A0,A1....Am] 与 [B0,B1...Bn] 的公共子序列长度 。问题转换为:
LCS(Am,Bn) = LCS(Am-1,Bn-1) + 1
(2)如果 Am !=Bn,且 Ck != Am,就是说,A 和 B 的最后一个字符不相同,但是呢,它们的公共子序列最后一个字符和 A 的最后一个字符不相等,那么,[C0,C1.....Ck] 也是 [A0,A1....Am-1] 与 [B0,B1...Bn] 的公共子序列.
(3)如果 Am !=Bn,且 Ck != Bm,就是说,A 和 B 的最后一个字符不相同,但是呢,它们的公共子序列最后一个字符和 B 的最后一个字符不相等,那么,[C0,C1.....Ck] 也是 [A0,A1....Am] 与 [B0,B1...Bn-1] 的公共子序列.
由(2)和(3)可得,如果 Am !=Bn,LCS(Am,Bn) = max { LCS(Am-1,Bn),LCS(Am,Bn-1) }
这里可以利用填表法进行描述,填表规则为:
if i = 0 or j = 0,则 c[i,j] = 0
if i,j>0 and ai = bj,则c[i,j] = c[i-1,j-1] + 1
if i,j >0 and ai != bj,则c[i,j] = max{c[i,j-1] ,c[i-1,j] }
表格如下:
(0) | A(0) | B(0) | C |