LCS算法学习

LCS问题就是求两个字符串最长公共子串的问题。解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置。

下面是字符串21232523311324和字符串312123223445的匹配矩阵,前者为X方向的,后者为Y方向的。不难找到,红色部分是最长的匹配子串。通过查找位置我们得到最长的匹配子串为:21232

但是在0和1的矩阵中找最长的1对角线序列又要花去一定的时间。通过改进矩阵的生成方式和设置标记变量,可以省去这部分时间。下面是新的矩阵生成方式:

不用多说,你大概已经看出来了。当字符匹配的时候,我们并不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断当前生成的元素的值是不是最大的,据此来改变标记变量的值,那么到矩阵完成的时候,最长匹配子串的位置和长度就已经出来了。
以上摘自:http://zhidao.baidu.com/link?url=Sc05MXVpiCCA2e4JcyShIhYEuoYiJSy5S-XBSOOWHoz6MYaNJtilECGEYsZTHg5KkVDX8oQgV4ZJ2cveSrqz3_

以上是基本原理介绍,然后我自己做了一个例子(用的是java).

private String lcs(String str1,String str2){
		int str1Len = str1.length();
		int str2Len = str2.length();
		//用于存放匹配的结果
		int[][] matchResult = new int[str1Len][str2Len];
		//用于记录匹配字符串的最大长度
		int max = 1;
		//用于记录匹配字符串的位置
		int end =0;
		for(int i =0; i < str1Len;i++){
			for(int j= 0; j< str2Len;j++){
				if(str1.charAt(i) == str2.charAt(j)){
					if(i == 0 || j == 0){
						matchResult[i][j] = 1;
					}else{
						matchResult[i][j] = matchResult[i-1][j-1] + 1;
					}
				}
				if(matchResult[i][j] > max){
					max =matchResult[i][j];
					end = j;
				}
			}
		}
		return str2.substring(end-max+1, end+1);
	}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值