一开始以为最长公共子序列就是最长公共子串,然而并不是。
子串,在位置上必须是连续的,但是子序列却不用。子序列是不改变原有字符的顺序,去掉其中的一些字符得到的序列,比如 aabbccdef,那么abcdef 是它的一个子序列。
再比如我们现在字符串 abcdef 和 abcedf ,最长公共子串明显是 abc,但是最长的公共子序列是 abcef 。
一个长度为 n 为的字符串,有 2^n 个子序列。每个子序列跟另一个字符串匹配,需要的时间O(m) ,所以总的时间复杂度为 (2^n)*m,指数型的复杂度显然是不理想的。
接下来我们利用动态规划的思想。我们设置一个二维数组 C[n+1][m+1] 来存储最长的子序列。C[ i ][ j ] 表示长度为 i 和长度为 j 的两个字符串的最长公共子序列。我们知道,如果其中一个字符串为空(长度为 0 )那么最长的公共子序列长度为 0 ,所以 C[0][ j ] = 0 , C[ i ][0] = 0 。时间复杂度为 O(n*m) 。状态转移方程:
最长公共子序列,常用于检查字符串的相似度。
我们也可以用动态规划的方法求解最长公共子串,类比上面的最长公共子序列,时间复杂度为 O(n*m),状态转移方程:
Max( C[ i ] [ j ] ) 就是最长公共子串的长度。
当然,也可以不用动态规划的方法求出最长公共子串,时间复杂度为O(n*m) ,并且不需要额外的辅助数组。具体的实现是:遍历字符串s1,并 将 s1 的每个字符与另一个字符串 s2 的字符比较,如果不想同则与 s2 的下一个字符比较;如果相同那么比较 s1 和 s2 的下一个字符,以此类推。统比较的过程统计相同的字符,最后得到的最大值就是最大子串的长度。
以上三个不同的方法的具体实现如下:
package com.hunter.Offer_Example;
import java.util.Scanner;
public class longestComSubString {
//动态规划,公共子序列
public int getLongest(String s1,int n,String s2,int m){
int[][] dp = new int[n+1][m+1];
for(int i = 0; i < n; i++)
dp[i][0] = 0;
for(int i = 0; i < m; i++)
dp[0][i] = 0;
for(int i = 1; i <= n; i++){
for(int j = 1; j <= m; j++){
if(s1.charAt(i - 1) == s2.charAt(j - 1))
dp[i][j] = dp[i - 1][j - 1] + 1;
else
dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
}
}
return dp[n][m];
}
//动态规划,最长公共子串
private int dpGetLongestSameSubStr(String s1,int n,String s2,int m){
int max = 0;
int[][] dp = new int[n + 1][m + 1];
//初始化 0
for(int i = 0; i < n; i++)
dp[i][0] = 0;
for(int i = 0; i < m; i++)
dp[0][i] = 0;
for(int i = 1 ; i <= n; i++){
for(int j = 1; j <= m; j++){
if(s1.charAt(i - 1) == s2.charAt(j - 1)){
dp[i][j] = dp[i - 1][j - 1] + 1;
if(dp[i][j] >= max)
max = dp[i][j];
}
else
dp[i][j] = 0;
}
}
return max;
}
//最长公共子串
private int getLongestSameSubStr(String s1,int n, String s2,int m) {
// TODO Auto-generated method stub
if(s1 == null || s2 == null)
return 0;
int d = 0;
for(int i = 0; i < n; i++){
int k = i;
int count = 0;
for(int j = 0; j < m && k < n; j++){
if(s1.charAt(k) == s2.charAt(j)){
count++;
k++;
if(count >= d){
d = count;
}
}
else{
if(k != i){
count = 0;
k = i;
}
}
}
}
return d;
}
}