题目
给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。
请你设计并实现时间复杂度为 O(n) 的算法解决此问题。
提示:
0 <= nums.length <= 10^5
-10^9 <= nums[i] <= 10^9
示例:
输入:nums = [100,4,200,1,3,2]
输出:4
解释:最长数字连续序列是 [1, 2, 3, 4]。它的长度为 4。
思路
题目要求找出最长序列,一般需要采用排序,但是要求时间复杂度为O(n),没有一种排序能到达这种时间复杂度,因此应排除排序法。
但是只有通过对部分值排序才能知道他们是连续的,这里我们可以发现如果i周围连续,那么必然是既有i+1,或有i-1。
同时,对于数字i有可能重复出现,虽然重复数字不影响连续性,但是我们是不是需要提前将这些重复项去掉?怎么去掉呢,这里可以采用哈希集合unorder_set筛出重复项。
同时我们可以发现,通过set也可以判断出i的左右i+1或i-1是否存在,因此我们可以通过set寻找连续序列。
我们可以这么做:
- 先将所有数存入set中
- 依次遍历set中的数x,对于每一个数x判断是否有x+1和x-1,如果有的话,继续找x-2和x+2等等等,直到找出这个的连续序列所有值,计算其长度,更新最大值maxx。
但是可以发现,遍历set中每个数字时,有可能重复寻找序列。比如数组 [1, 2, 3, 4],开始遍历1时找到最大序列是 [1, 2, 3, 4],长度为4,更新maxx;接着遍历set中的2,又判断一次这个序列,它的最长序列为4;3、4同样也是。这样就有很多重复工作。
因此我们需要改进一下,怎么能让刚刚判断完的连续序列,下次不再进行判断呢?
如果这是一个连续序列,我们可以从这个序列的一头出发计算其长度。只有当前这个数是序列的头或尾,才计算长度。
比如 [100,4,200,1,3,2],当set遍历到4,我们发现4+1=5不在set中,我们就确定他是一个连续序列的尾,我们可以寻找他前面的值4-1=3,如果3存在,我们再寻找2,1。而set遍历到3时,因为3+1=4存在,我们就不寻找他这个序列的长度,这样可以避免一些重复操作。
代码
class Solution {
public:
int longestConsecutive(vector<int>& nums) {
unordered_set<int> f;
for(auto x:nums){
if(!f.count(x))
f.emplace(x);
}
int maxx = 0, right, sum = 0;
for(auto x:f){
if(!f.count(x+1)){
sum = 1;
while(f.count(x-1)){
x--;
sum++;
}
maxx = max(sum, maxx);
}
}
return maxx;
}
};