Java动态规划求解最长公共子串问题

 最长公共子串问题:一个给定序列的子序列是在该序列中删去若干元素后得到的序列。给定两个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z 是序列X和Y的公共子序列。最长公共子串就是求给定两个序列的一个最长公共子序列。例如,X=“COBEBRANT”,Y=“COBAT”是X的一个子序列。

问题分析:

给定两个序列A和B,称序列Z是A和B的公共子序列,是指Z同是A和B的子序列。问题要求已知两序列A和B的最长公共子序列。如采用列举A的所有子序列,并一一检查其是否又是B的子序列,并随时记录所发现的子序列,最终求出最长公共子序列。这种方法因耗时太多而不可取。

考虑最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1” 为它们的最长公共子序列。不难证明有以下性质:

(1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn- 2”的一个最长公共子序列;

(2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1” 的一个最长公共子序列;

(3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2” 的一个最长公共子序列。

这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。

为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法,具体说明如下。

定义lcs[i][j]为序列“a0,a1,…,ai-2”和“b0,b1,…,bj-1”的最长公共子序列的长度,计算lcs[i][j]可递归地表述如下:

(1)lcs[i][j] = 0                         如果i=0或j=0;

(2)lcs[i][j] = c[i-1][j-1]+1             如果i,j>0,且a[i-1] = b[j-1];

(3)lcs[i][j] = max{c[i][j-1], c[i-1][j]} 如果i,j>0,且a[i-1] != b[j-1]。

按此算式可写出计算两个序列的最长公共子序列的长度函数。由于c[i][j]的产生仅依赖于lcs[i-1][j-1]、lcs[i-1][j]和lcs[i][j- 1],故可以从lcs[m][n]开始,跟踪lcs[i][j]的产生过程,逆向构造出最长公共子序列。细节见程序。

  1. package com.algorithm;  
  2.   
  3. //动态规划实现最小公共字符串问题  
  4. public class ComSubstr {  
  5.   
  6.     public static void main(String[] arg) {  
  7.         String a = "blog.csdn.net";  
  8.         String b = "csdn.blogt";  
  9.         comSubstring(a, b);  
  10.     }  
  11.   
  12.     private static void comSubstring(String str1, String str2) {  
  13.         char[] a = str1.toCharArray();  
  14.         char[] b = str2.toCharArray();  
  15.         int a_length = a.length;  
  16.         int b_length = b.length;  
  17.         int[][] lcs = new int[a_length + 1][b_length + 1];  
  18.         // 初始化数组  
  19.         for (int i = 0; i <= b_length; i++) {  
  20.             for (int j = 0; j <= a_length; j++) {  
  21.                 lcs[j][i] = 0;  
  22.             }  
  23.         }  
  24.         for (int i = 1; i <= a_length; i++) {  
  25.             for (int j = 1; j <= b_length; j++) {  
  26.                 if (a[i - 1] == b[j - 1]) {  
  27.                     lcs[i][j] = lcs[i - 1][j - 1] + 1;  
  28.                 }  
  29.                 if (a[i - 1] != b[j - 1]) {  
  30.                     lcs[i][j] = lcs[i][j - 1] > lcs[i - 1][j] ? lcs[i][j - 1]  
  31.                             : lcs[i - 1][j];  
  32.                 }  
  33.             }  
  34.         }  
  35.         // 输出数组结果进行观察  
  36.         for (int i = 0; i <= a_length; i++) {  
  37.             for (int j = 0; j <= b_length; j++) {  
  38.                 System.out.print(lcs[i][j]+",");  
  39.             }  
  40.             System.out.println("");  
  41.         }  
  42.         // 由数组构造最小公共字符串  
  43.         int max_length = lcs[a_length][b_length];  
  44.         char[] comStr = new char[max_length];  
  45.         int i =a_length, j =b_length;  
  46.         while(max_length>0){  
  47.             if(lcs[i][j]!=lcs[i-1][j-1]){  
  48.                 if(lcs[i-1][j]==lcs[i][j-1]){//两字符相等,为公共字符  
  49.                     comStr[max_length-1]=a[i-1];  
  50.                     max_length--;  
  51.                     i--;j--;  
  52.                 }else{//取两者中较长者作为A和B的最长公共子序列  
  53.                     if(lcs[i-1][j]>lcs[i][j-1]){  
  54.                         i--;  
  55.                     }else{  
  56.                         j--;  
  57.                     }  
  58.                 }  
  59.             }else{  
  60.                 i--;j--;  
  61.             }  
  62.         }  
  63.         System.out.print("最长公共字符串是:");  
  64.         System.out.print(comStr);  
  65.     }  
  66. }  



以下是程序输出结果:

  1. 0,0,0,0,0,0,1,2,2,2,2,  
  2. 0,0,0,0,0,0,1,2,3,3,3,  
  3. 0,0,0,0,0,0,1,2,3,4,4,  
  4. 0,0,0,0,0,1,1,2,3,4,4,  
  5. 0,1,1,1,1,1,1,2,3,4,4,  
  6. 0,1,2,2,2,2,2,2,3,4,4,  
  7. 0,1,2,3,3,3,3,3,3,4,4,  
  8. 0,1,2,3,4,4,4,4,4,4,4,  
  9. 0,1,2,3,4,5,5,5,5,5,5,  
  10. 0,1,2,3,4,5,5,5,5,5,5,  
  11. 0,1,2,3,4,5,5,5,5,5,5,  
  12. 0,1,2,3,4,5,5,5,5,5,6,  
  13. 最长公共字符串是:csdn.t 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值