LCS(Longest Common Subsequence 最长公共子序列)

一、基本定义

LCS是Longest Common Subsequence的缩写,即最长公共子序列。一个序列,如果是两个和多个已知序列的子序列,且是所有子序列中最长的,则为最长公共子序列。

子串 != 子序列
子串:是连续在一起的;
子序列:子序列中的字符在字符串中不一定连续,但是子序列一定是单调的(即字符之间ASCII单调递增或单调递减)(有误!!!)

一个序列S任意删除若干个字符得到新序列T,则T叫做S的子序列;
两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列。(注意区别最长公共子串,最长公共子串要求连续)

暴力求解:穷举法,时间复杂度太大,不可取

1、假定字符串X,Y的长度分别为m,n;
2、X的一个子序列即下标序列{1,2,3…,m}的严格递增子序列,因此,X共有2^m个不同的子序列(很好理解,对与每一个元素取或不取两种情况,m个的话就死2x2x2x2….x2(m个),即2^m个;同理Y有2^n个不同子序列,从而穷举法需要指数时间O(2^m*2^n);
3、对X的每一个子序列,检查它是否也是Y的子序列,从而确定它是否为X和Y的公共子序列,并且在检查过程中选出最长的公共子序列;
4、显然,不可取;

LCS的记号
Xi=< x1, … ,xi>即X序列的前i个字符 (1<= i <=m)(Xi不妨读作,“字符串X的i前缀”);
Yi=< y1, … ,yj>即X序列的前j个字符 (1<= j <=m)(Yj不妨读作,“字符串Y的j前缀”);
LCS(X,Y) 为字符串X和Y的最长公共子序列 ,即为Z= < z1, … ,zk> 。
注意:不严格的表述,事实上,X和Y可能存在多个长度相同并且最大的子串,因此,LCS(X,Y)严格的说,是个字符串集合。即:Z ->LCS (X, Y).

LCS解法的探索

若xm=yn,则有zk = xm = yn;
也即 LCS(Xm,Yn) = LCS (Xm-1, Yn-1) + xm

若xm!=yn,则有zk != xm != yn;
也即 LCS(Xm,Yn) = LCS (Xm-1, Yn) 或 LCS(Xm, Yn-1)中的最大者;

这里写图片描述

算法中的数据结构:长度数组

1、使用二维数组C[i,j]
2、c[i,j]记录序列Xi和Yj的最长公共子序列的长度,显然c[i,j] = 0;

这里写图片描述

应用实例 最长递增子序列(Longest Increasing Subsequence)
给定一个长度为N的数组,找出一个最长的单调递增子序列。
例如:给定数组{5,6,7,1,2,8},则其最长的单调递增子序列为{5,6,7,8},长度为4。

解题思路:将LIS问题转化为LCS问题
这里写图片描述

memset函数

#include <string.h>
void *memset( void *buffer, int ch, size_t count );
功能: 函数拷贝ch 到buffer 从头开始的count 个字符里, 并返回buffer指针。 memset() 可以应用在将一段内存初始化为某个值。
例如:
memset( the_array, '\0', sizeof(the_array) );
这是将一个数组的所以分量设置成零的很便捷的方法。

LCS代码

#include <iostream>
#include <cstring>
using namespace std;

#define MAX(a,b) (a>b?a:b)
//#define MAXN 1001
const int MAXN = 1001;
int C[MAXN][MAXN];


int main (void) {

    string X, Y;
    while(cin>>X>>Y)  {
        int m = X.length();
        int n = Y.length();

        for (int i = 1; i <= m; i++) {
            C[i][0] = 0;
        }
        for (int j = 1; j <= n; j++) {
            C[0][j] = 0;
        }

        int max = 0;
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                if (X[i-1] == Y[j-1]) 
                //注意公式里Xi对应这里是Xi-1,
                    C[i][j] = C[i-1][j-1] + 1;

                else 
                    C[i][j] = MAX (C[i-1][j],C[i][j-1]);
            }
        }
        cout<<C[m][n]<<endl;

    }

    return 0;
}


最长回文字符串笔试题

#include <iostream>
#include <string>
#include <algorithm>
using namespace std;

#define MAX(a,b) (a>b?a:b)

const int MAXN = 1001;
int C[MAXN][MAXN];
int LCS(string X, string Y) {
    int m = X.length();
    int n = Y.length();

    for (int i = 0; i < m; i++) {
        C[i][0] = 0;
    }
    for (int i = 0; i < n; i++) {
        C[0][i] = 0;
    }

    for (int i = 1; i <= m; i++) {
        for (int j = 1; j <= n; j++) {
            if (X[i-1] == Y[j-1]) {
                C[i][j] = C[i-1][j-1] + 1;
            }
            else {
                C[i][j] = MAX( C[i-1][j], C[i][j-1]);
            }
        }
    }
    return C[m][n];
}

int main (void) {
    string str1;
    while(cin>>str1) {
        if (str1.length() == 1){
            cout << 1 << endl;
            continue;
        }
        string str2 = str1;
        reverse(str1.begin(), str1.end());
        cout<<str1.length() - LCS(str1,str2)<<endl;
    }
    return 0;
}
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值