原题链接:
http://www.lintcode.com/zh-cn/problem/longest-consecutive-sequence/
题目描述
给定一个未排序的整数数组,找出最长连续序列的长度。
说明
要求你的算法复杂度为O(n)
样例
给出数组[100, 4, 200, 1, 3, 2],这个最长的连续序列是 [1, 2, 3, 4],返回所求长度 4
题目解析:
从一个数组整数数组中找最长的连续序列。首先,连续序列的意思是[1,2,3,4,7],其中,[1,2,3,4]就是连续序列。最长的连续序列的意思,一个数组中可能会有多个连续序列,题目要求的就是最长的那个,而且只需要返回其长度。
题目中给出的未排序的整数数组。那我们的第一个思路,肯定是先排序,然后再求解。排序后就很简单了。但是题目要求复杂度为O(n),所以就不能使用排序了,因为排序最快的复杂度是o(nlogn)。
思路
思路一
有个比较简单的想法,我们先拿到数组中的一个元素i,然后从数组中遍历查找到i-1,i-2...如果找不到,证明连续序列断了,记录下前面的长度为leftLength。接着遍历查找到i+1,i+2...记录下其长度rightLength。那么,在整个数组中,与i相连的那个连续序列就找到了。而且序列的长度length=leftLength+rightLength+1.接着再从数组中拿到元素j,遍历查找到j-1,j-2...然后遍历查找到j+1,j+2...以此类推,就能找到所有的连续序列。 但是这里有两个问题需要解决:
-
从数组中查找特定元素i-1,其复杂度为O(n),显然复杂度不符合要求。我们想要的是直接O(1)复杂度就能查找到i-1。没错,字典就能实现。将数组的所有元素作为字典的key,那么在字典中查找i-1这个key,就代表数组里面有i-1这个元素。
-
去了i之后,接着查找i-1,i-2...由于这些元素是连续序列,所以操作过后需要把他们删除掉。删除掉是不会有影响的。但是不删除,就会有很多无用的重复操作。比如i的时候,查找到i-1,那些下次拿到i-1,又查找到了同一个连续序列,没有意义,而且复杂度也高。
基于以上思路,由于字典中的每个元素都只遍历了一次,所以时间复杂度为O(n),用到了一个字典存储所有的元素,所以控件复杂度也为n。
思路二
跟思路一相同,使用字典来存储数组中的元素,以数组中的元素为key,但是value是已经查找到的与元素有关的连续序列的长度。 我从数组中拿到值为i的元素,接着我查找key为i-1和i+1的元素,如果存在,则记其value分别为leftLength和rightLength。这时,设key为i的元素的value值length=leftLength+rightLength+1.添加到字典里面去。同时,将i-leftLength和i+rightLength的元素(也就是已知的跟i有关的连续序列的两端的元素,实际上你可以更新所有跟i有关的元素的值,但是这样做没有意义,中间的元素以后再也用不到了)的value也设为length。当所有的元素都遍历完了,就能查找到最大的连续序列长度了。
文字说明有点难理解,用几个简单的元素说明下。
数组[1,3,2,7,4] 字典初始化为空{}
第一次遍历拿到1(没查找到值):结果{1:1}
第二次遍历拿到3(没查找到值):结果{1:1,3:1}
第三次遍历拿到2(查找到1和3):结果{1:3,2:3,3:3}
第四次遍历拿到7(没查找到值):结果{1:3,2:3,3:3,7:1}
第五次遍历拿到4(查找到3):结果{1:4,2:3,3:3,4:4,7:1}(注意这里更新的是1:4)
代码(Python)
思路一代码
"""
@param num: A list of integers
@return: An integer
"""
def longestConsecutive(self, num):
#最大的连续序列长度
maxLength = 0
#字典,key为num的元素,value都是True
numDict = {}
for i in num:
numDict[i] = True
for i in num:
if not numDict.has_key(i):
continue
leftLength = 0
rightLength = 0
left = i-1
right = i+1
#往左遍历,直到left-1不存在
while numDict.has_key(left):
#找到了就删除元素,避免重复查找
del numDict[left]
leftLength += 1
left -= 1
#往右遍历,直到right+1不存在
while numDict.has_key(right):
#找到了就删除元素,避免重复查找
del numDict[right]
rightLength += 1
right += 1
#删除当前元素,避免重复查找
del numDict[i]
#计算与i相连的连续序列的长度
length = leftLength + rightLength + 1
maxLength = max(maxLength,length)
return maxLength
复制代码
思路二代码
"""
@param num: A list of integers
@return: An integer
"""
def longestConsecutive1(self, num):
# write your code here
#字典,key是num中的元素,value是当前算出来的与该数相连的连续序列的长度
numDict = {}
#最大的连续序列长度
maxLength = 0
for i in num:
#如果之前已经操作过i,则不再操作
if numDict.has_key(i):
continue
left = 0
right = 0
leftKey = i-1
rightKey = i+1
#能在字典中找到i-1这个key,拿到left的值
if numDict.has_key(leftKey):
left = numDict[leftKey]
#能在字典中找到i+1这个key,拿到right的值
if numDict.has_key(rightKey):
right = numDict[rightKey]
#与i相连的连续序列的长度
length = left + right + 1
print "i= %d left= %d right=%d length= %d"%(i,left,right,length)
#存到字典
numDict[i] = length
#更新与i相连的连续序列的最左边和最右边的长度值
numDict[i-left] = length
numDict[i+right] = length
maxLength = max(maxLength,length)
return maxLength
复制代码
谦言忘语
个人目前只懂一丁点python语法,所以不做语法上的优化,而且整体代码风格效果会尽量跟C语言趋于一致。