最长递增子序列O(nlogn)和O(n2)

最新推荐文章于 2022-05-27 16:08:02 发布

kylehit

最新推荐文章于 2022-05-27 16:08:02 发布

阅读量2.5k

点赞数

分类专栏：算法文章标签：算法

算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

单调子序列包含有单调递增子序列和递减子序列，不失一般性，这里只讨论单调递增子序列。首先，从定义上明确我们的问题。给定序列a₁, a₂, …, a_n，如果存在满足下列条件的子序列

a_i1<=a_i2<=…<=a_im, (其中i1<i2<…<im)

即称为一个原序列的长度为m的单调递增子序列，那么，现在的问题是我们要找出一个序列的最长的单调递增子序列。

直观上来说，一个序列S_n，它有2ⁿ个子序列，枚举所有的子序列，找出其中单调递增的序列，然后返回其中最长的，这样我们的问题就解决了。当然，这个直观的算法在时间上为O(2ⁿ*n)，它的复杂度增长太快了，所以，我们还应该做得更好一些。

于是，我们换个角度思考。假设我们对S_n排序（递增），得到S_n’。那么，S_n和S_n’的最长公共子序列C_m就是我们要求的最长单调递增子序列（如果你不清楚最长公共子序列的定义，just google it）。为什么？假设C_m’是S_n的最长单调子列，且C_m’!=C_m， C_m’的长度大于C_m。由于C_m’是递增的，并且C_m’的每一个元素都来自S_n，所以C_m’一定是S_n’的子列，而C_m’又是S_n的子列，所以C_m’是S_n和S_n’的公共子列，故C_m’的长度一定小于C_m，这与假设矛盾，所以C_m是最长单调子列。理论上我们的算法是正确的，复杂度方面，运用动态规划(dynamic programming)来求解LCS（最长公共子列，Longest-Common-Subsequence），时间上是O(n²)，空间上也是O(n²)。于是，对S_n排序需要nlogn的时间，而LCS需要n²，最后，我们的算法时间上是O(n²)。

可以看到，通过上面的改进，我们的算法效率得到了很大的提升（从指数增长到多项式增长）。不过，程序设计的乐趣就是它会不断地给我们一些惊喜，所以，就此打住不是我们该做的，于是，更好的算法应该是存在的。

对于序列S_n，考虑其长度为i的单调子列(1<=i<=m)，这样的子列可能有多个。我们选取这些子列的结尾元素（子列的最后一个元素）的最小值。用L_i表示。易知

L₁<=L₂<=…<=L_m

如果L_i>L_j(i<j)，那么去掉以L_j结尾的递增子序列的最后j-i个元素，得到一个长度为i的子序列，该序列的结尾元素a_k<=L_j<L_i，这与L_i标识了长度为i的递增子序列的最小结尾元素相矛盾，于是证明了上述结论。现在，我们来寻找S_n对应的L序列，如果我们找到的最大的L_i是L_m，那么m就是最大单调子列的长度。下面的方法可以用来维护L。

从左至右扫描S_n，对于每一个a_i，它可能

(1) a_i<L₁，那么L₁=a_i

(2) a_i>=L_m，那么L_m+1=a_i，m=m+1 (其中m是当前见到的最大的L下标)

(3) L_s<=a_i<L_s+1，那么L_s+1=a_i

扫描完成后，我们也就得到了最长递增子序列的长度。从上述方法可知，对于每一个元素，我们需要对L进行查找操作，由于L有序，所以这个操作为logn，于是总的复杂度为O(nlogn)。优于开始O(n²)的算法。这里给出我的一个实现：（算法并没有返回具体的序列，只是返回长度）

template <typename T>
int LMS (const T * data, int size)
... {
    if (size <= 0 )
        return 0 ;

    T * S = new T[size];
    int S_Count = 1 ;
    S[0] = data[0 ];

    for (int i = 1; i < size; i++ )
    ... {
        const T & e = data[i];
        int low = 0, high = S_Count - 1 ;

        while (low <= high)
        ... {
            int mid = (low + high) / 2 ;

            if (S[mid] == e)
                break ;
            else if (S[mid] > e)
            ... {
                high = mid - 1 ;
            }
             else
             ... {
                low = mid + 1 ;
            }
        }

         // well, in this point
        // high is -1, indicating e is the smallest element.
        //otherwise, high indicates index of the largest element that is smaller than e
        if (high == S_Count - 1 )
            S[S_Count++] = e;
        else
            S[high + 1] = e;
    }

     return S_Count;
}

转自 http://skynewborn.blog.sohu.com/66594610.html