Longest Common Subsequence
Description
Given two strings, find the longest common subsequence (LCS).
Your code should return the length of LCS.
Clarification
What’s the definition of Longest Common Subsequence?
https://en.wikipedia.org/wiki/Longest_common_subsequence_problem
http://baike.baidu.com/view/2020307.htm
Example
For "ABCD" and "EDCA", the LCS is "A" (or "D", "C"), return 1.
For "ABCD" and "EACB", the LCS is "AC", return 2.
实现思路
注意最长公共子序列(本题)和最长公共子串(Longest Common Substring 解题报告)的区别。
最长公共子序列不要求连续,即子序列里的两个相邻字符在原串中不一定相邻,只是前后顺序一致。
设有两字符串A,B,构建状态数组dp[A.length][B.length]
设dp[i][j]为A[0…i], B[0…j]的最长公共子序列
则有状态方程:
1. X[i] == Y[j],dp[i][j] = dp[i-1][j-1] + 1
2. X[i] != Y[j],dp[i][j] = Math.max(dp[i][j-1],dp[i-1][j]);
对于上述状态转移方程,我们可以通过下面这段内容来理解:
考虑最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1”为它们的最长公共子序列。不难证明有以下性质:
(1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一个最长公共子序列;
(2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列;
(3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列。
这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。
/**
* @param A, B: Two strings.
* @return: The length of longest common subsequence of A and B.
*/
public int longestCommonSubsequence(String A, String B) {
if(A == null || B == null
|| A.isEmpty() || B.isEmpty()){
return 0;
}
int n = A.length();
int m = B.length();
int dp[][] = new int[n+1][m+1];
int lcs = 0;
for(int i = 0 ; i < n; i ++){
for(int j = 0 ; j < m;j ++){
if(A.charAt(i) == B.charAt(j)){
dp[i+1][j+1] = 1 + dp[i][j];
lcs = Math.max(dp[i+1][j+1],lcs);
}else{
dp[i+1][j+1] = Math.max(dp[i+1][j],dp[i][j+1]);
}
}
}
return lcs;
}