今天,我给大家带来的是“最长公共子序列”(LCS)的讲解。限于水平,这里仅介绍O(nm)算法。
最长公共子序列其实是很好理解的。
顾名思义,给出多个(这里暂且只考虑两个)序列,求他们的最长公共子序列,就是在这两个序列中分别删去一些的字符,得到两个相同的序列,使得这两个相同的序列最长。
当然上面是我自己用比较好理解的方法写的,关于某些“百科”上的解释就是“一个序列S,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列。而最长公共子串(要求连续)和最长公共子序列是不同的 ”。
这里要先牵扯到一个“子序列”的问题。子序列就是一个序列中,删去一些字符后剩下部分。例如,“abc”就是“axbyc”的一个子序列,他相应的子序列在原序列的下标就是“1,3,5”。
再比如,
令字串A为“abcdef”,字串B为“defghi”,那么他们的最长公共子序列是什么呢?
显然,是“def”。因为子串“d”、“e”和“f”长度均为1,子串“de”、“ef”和“df”均为2,只有“def”长度为3。
所以,现在,我们给出两个序列,求他们的最长公共子序列。
【输入格式】
共两行。每行给出一个长度不超过200的字符串。
【输出格式】
共两行。第一行一个非负整数表示最长公共子序列的长度。第二行输出这个子序列(若有多解,任意输出一个)。
【输入样例】
ABCBDAB
BDCABA