问题:
给定数组arr,返回arr的最长递增子序列
举例:
arr = [2,1,5,3,6,4,8,9,7],返回最长递增子序列[1,3,4,8,9]
基本思路
首先介绍时间复杂度为O(N^2)的方法。具体过程如下:
生成长度为N(arr的长度)的数组dp,dp[i]表示在以arr[i]结尾的情况下,arr[0…i]中的最长子序列。
dp[0]表示以arr[0]结尾的情况下最长子序列,只有它自己,设为1
对于dp的其他位置,从左到右依次遍历,假设遍历到i,首先在arr[0…i-1]中找到比arr[i]小且相应的dp值最大的位置记为j,arr[j]即为以arr[i]结尾的倒数第二小的数,此时dp[i]的值便可以确定,dp[i] = dp[j] + 1。如果arr[0…i-1]中没有比arr[i]小的值,则dp[i]直接记为1
接下来就是利用生成好的dp数组得到最长的递增子序列:
首先遍历找到dp数组中的最大值maxlen以及下标index,其中maxlen就是最长递增子序列的长度,arr[index]就是最长递增子序列的最后一个数字,然后从index向前遍历数组arr,找到比arr[index]小的数arr[j]并且dp[j] + 1 = dp[index],这个值就是子序列的倒数第二个数,依次向前遍历即可得到最长递增子序列。
def getlist(arr):
if arr == None or len(arr) == 0:
return None
dp = getdp(arr)
return getOrderLIS(arr,dp)
def getdp(arr):
dp = [0 for i in range(len(arr))]
for i in range(len(arr)):
dp[i] = 1
for j in range(i):
if dp[i] < dp[j]:
dp[i] = max(dp[i],dp[j]+1)
return dp
def getOrderLIS(arr,dp):
maxlen = 0
index = 0
"""找到最大值及索引"""
for i in range(len(arr)):
if arr[i] > maxlen:
maxlen = arr[i]
index = i
res = [0 for i in range(maxlen)]
res[maxlen-1]= arr[index]
maxlen -=1
"""找到之后,从右向左查找"""
for j in range(index,-1):
if arr[j] < arr[index] and dp[j] == dp[index] - 1:
res[maxlen-1] = arr[j]
maxlen -=1
index = j
return res
接下里介绍一个时间复杂度为O(NlogN)的方法。
该方法是在生成dp数组的时候利用二分查找来进行优化,通过另外一个辅助数组ends完成。ends[b]的含义为遍历到目前位置,长度为b + 1的子序列的最小结尾。过程如下:
生成长度为N的dp数组和ends数组,令dp[0] = 1,ends[0] = arr[0]。
从左到右遍历arr的剩余部分,假设遍历到位置i,首先在ends中已有的数值中找第一个比arr[i]大的数的位置k(使用二分查找),把该位置的数替代为arr[i],dp[i] = k + 1。依次遍历即可得到dp数组
def getdp2(arr):
dp = [0 for i in range(len(arr))]
ends = [0 for i in range(len(arr))]
right = 0
dp[0] = 1
ends[0] = arr[0]
for i in range(1,len(arr)):
l = 0
r = right
while l <= r:
m = (l+r)//2
if arr[i] > ends[m]:
l = m + 1
else:
r = m - 1
right = max(right,l)
dp[i] = l + 1
ends[l] = arr[i]
return dp
def getlist(arr):
if arr == None or len(arr) == 0:
return None
dp = getdp2(arr)
return getOrderLIS(arr,dp)