最长递增子序列

最新推荐文章于 2024-09-08 15:12:17 发布

_luozhenj

最新推荐文章于 2024-09-08 15:12:17 发布

阅读量778

点赞数

分类专栏： introductio to algorithm:notes 文章标签：算法数据结构 null 优化

本文链接：https://blog.csdn.net/lzj509649444/article/details/7066279

版权

introductio to algorithm:notes 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

最长递增子序列

令S是不同整数x₁,x₂,….,x_n的序列。S的递增序列（IS）是序列x_i1,x_i2,….x_ik,其中i₁<i₂<….i_k，使得对任意的1<=j<k，有x_ij<x_ij+1。S的最长递增序列（LIS）是具有最大长度的递增序列。

问题：给定一个由不同整数组成的序列，求它的最长递增序列。

归纳假设（首次尝试）：给定某个长度小于m的序列，知道如何求它的某个最长的递增序列。

归纳基础包含长度为1的序列，结论显然。给定长度为m的序列，我们先对前m-1个元素求得其中的一个LIS，然后考察x_m。如果x_m比LIS中最后一个归纳的元素大，则x_m就能加到LIS的末尾，形成新的LIS，解答完毕。如果x_m不大于LIS中最后一个归纳的元素，则问题无法继续解决。例如可能有多个LIS，而x_m也许只能使其中一个更长，而这个LIS未必就是由归纳法得到的那个。

导致上述归纳失败的原因是，可能存在多个最长的LIS。再进一步归纳：

归纳假设（第二次尝试）：给定某个长度小于m的序列，知道如何求它的所有最长的递增序列。

这个归纳假设也不行，假如x_m不能使任何LIS变长，还有可能存在比最长的短1的IS，且x_m可以使它变长，从而得到新的LIS。而我们如果想求第二长的IS，就必须求出所有第三长和第四长的IS，如此等等，这充分说明了这个归纳假设过强了。

那是否真的需要所有的LIS吗？我们只想知道x_m是否能让其中某个LIS变长，那么能否找到其中最有可能变长的LIS呢？在所有的LIS中，末尾最小的那个数是最有希望的。

归纳假设（第三次尝试）：给定某个长度小于m的序列，知道如何求它的某个最长的递增序列LIS，使得其他LIS的末尾的数都比这个LIS末尾的数大。

这个归纳假设也存在于第二次归纳时同样的情形。现在问题已经很明朗了，不能随意丢弃短的IS，也许其中某个IS就是最终那个LIS的起始序列。

我们用BIS(k)表示长度为k的最可能的递增序列，即以最小数结尾的序列（如果不止一个，则任取其中某个）。把BIS(k)中末尾的数记为BIS(k).last

归纳假设（第四次尝试）：给定某个长度小于m的序列，知道如何对任意k<m-1求出BIS(k)，如果存在的话。

归纳基础显然成立。给定x_m，要求出它可以改变的那些BIS。x_m能加长某个BIS（k）当且仅当下列两个条件成立：（1）x_m>BIS(k)，于是x_m可加入BIS(k)；（2）x_m<BIS(k+1).last，于是BIS(k)末尾加上x_m后比BIS(k+1)的可能性更大。算法如下：给定某个x_m，依次查看BIS(i).last的值，其中i=s，s-1，s-2等，知道找到某个BIS(j).last小于x_m。如果这样的j不存在，那么x_m就是当前序列中最小的数，并将其作为BIS(1)。若j=s，则把x_m加在BIS(s)后，构造出一个新的BIS(s+1)。否则，有BIS(j).last<x_m<BIS(j+1).last，于是用BIS(j+1)替换BIS(j)x_m。这个算法还可以进一步优化，由于集合是有序的，所以可以用二叉搜索进行查找。这样，每个x_m最多增加O(logm)次比较，整个运行时间为O(nlog n)。现在问题变为，如何设计数据结构来实现上述算法。

参考代码：

int binarysch(const int *arr, int len,int key)
{
	if(arr == NULL || len < 0)
		return -1;

	int left = 0;
	int middle = 0;
	int right = len - 1;

	//为什么要判断=呢？因为可能left、right的值在循环前不等，循环后相等呢，此时还应该处理这个值
	while(left <= right)
	{
		middle = left + (right - left) / 2;
		if(arr[middle] < key)
			left = middle + 1;
		else if(arr[middle] > key)
			right = middle - 1;
	}

	return right;
}

int LIS(int *arr,int length)
{
	if(arr == NULL || length <=0)
		return -1;

	//初始化为0
	int *lenarr = new int(length);
	memset(lenarr,0,length);

	//第一个数，此时长度为1，以它自己结尾
	lenarr[0] = arr[0];

	//记录LIS
	int curlen = 1;

	for(int i = 1; i < length; ++i)
	{
		//直接添到末尾，得到新的LIS
		if(arr[i] > lenarr[curlen-1])
			lenarr[++curlen - 1]=arr[i];
		else
		{
			//查找可能变长的IS
			int pst = binarysch(lenarr,curlen,arr[i]);
			lenarr[pst+1] = arr[i];
		}
	}

	return curlen;
}


int main(int argc, char **argv)
{
	int arr[] = {7,2,3,1,2,4,5,8,9,10,11,6,8,9,10,11};

	int lis = LIS(arr,16);
	
	for(;;);
	return(0);
}

经过上述分析，可知，当第一次进行归纳时，未必能得到结果，此时需要调整归纳假设；当我们对第i步进行分析时，可能还有很多沉余的信息。例如，假设知道如何求长度小于m的所有IS，现在来考虑m+1，此时需要记录所有已m+1为结尾的IS。那么怎么记录这些信息呢，该用什么样的数据结构呢？之前我就被困在这里，不知道如何记录所有的IS，所以想到算法，还应当能实现出来。最后想到用二维数组来记录，i表示IS长度，j表示当前处理的长度，则[i,1…j]表示构成所有长度为i的末尾的数为j。对这个算法在仔细分析，并不需要记录所有的IS，这就是改进，性能好的算法并不是一步想出来的。

_luozhenj

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
最长递增子序列

最长递增子序列令S是不同整数x1,x2,….,xn的序列。S的递增序列（IS）是序列xi1,xi2,….xik,其中i12k，使得对任意的1ijij+1。S的最长递增序列（LIS）是具有最大长度的递增序列。问题：给定一个由不同整数组成的序列，求它的最长递增序列。归纳假设（首次尝试）：给定某个长度小于m的序列，知道如何求它的某个最长的递增序列。归纳基础包含长度为1的序列，结论显然。给
复制链接

扫一扫

专栏目录