四数之和是一个经典的多指针算法问题,这类问题在编程面试中非常常见。在实现过程中,容易犯的错误通常涉及边界条件处理、重复结果的处理、以及效率低下的问题。
易错点
-
处理重复结果:
- 当数组中有重复元素时,如果没有正确处理,很容易生成重复的四元组。正确的做法是在发现一个有效四元组后,需要跳过所有相同的元素。
-
边界条件检查:
- 数组长度不足4时应直接返回空结果。
- 必须保证四个指针的选择不重叠,且正确移动指针。
-
整数溢出:
- 对于包含很大或很小整数的数组,进行四数之和可能会导致整数溢出。使用更大范围的整数类型如
long
可以避免这个问题。
- 对于包含很大或很小整数的数组,进行四数之和可能会导致整数溢出。使用更大范围的整数类型如
-
过早终止循环:
- 在确定前两个数后,不能仅因为它们的和已经大于目标值就终止循环,尤其是当目标值为负数时。因为后面可能存在负数使总和达到目标。
-
效率问题:
- 简单的四重循环会导致非常低的效率。应采用排序和双指针技术减少不必要的循环。
解题步骤:
- 排序:首先对数组进行排序。
- 外层循环:用两个嵌套循环遍历每一对可能的第一和第二个元素。
- 内层双指针:对每对确定的元素,使用两个指针分别指向剩下元素的开始和结束位置,进行双指针搜索。
- 跳过重复元素:在找到符合条件的四元组后,需要跳过重复元素,以避免生成重复的四元组。
复杂度
- 时间复杂度
- 排序操作:
- 使用的排序算法通常是快速排序,其平均时间复杂度为 (O(n \log n)),其中 (n) 是数组中的元素数量。
- 四数之和查找:
- 外层有两重循环,第一重循环枚举第一个数 (i),它的次数为 (O(n));
- 第二重循环枚举第二个数 (j),由于 (j) 从 (i+1) 开始,因此它的平均次数也是 (O(n)),但由于它嵌套在第一重循环里,总的复杂度变为 (O(n^2));
- 对于每对 (i) 和 (j),使用双指针法在 (O(n)) 时间内处理剩余的两个数。由于这个操作是嵌套在两重循环中的,所以这部分的时间复杂度是 (O(n^3))。
因此,总的时间复杂度是由最高阶的 (O(n^3)) 决定的,即 (O(n^3))。
- 空间复杂度
- 额外空间:
- 排序操作通常需要 (O(\log n)) 的空间复杂度(快速排序的栈空间)。
- 存储结果的向量空间除外,算法本身使用的额外空间主要是双指针所需的 (O(1)) 空间,因此除结果存储外,空间复杂度主要由排序决定,即 (O(\log n))。
总结
四数之和问题的算法复杂度主要受到三重循环的影响,时间复杂度为 (O(n^3))。在空间复杂度方面,除了输出结果需要的空间外,主要是排序操作所需的 (O(\log n)) 空间。这种算法适用于元素数量不是非常大的情况,对于大数据集,这种 (O(n^3)) 的算法可能会变得不切实际。
代码:
class Solution {
public:
vector<vector<int>> fourSum(vector<int>& nums, int target) {
vector<vector<int>> res;
if(nums.size() < 4) return res;
sort(nums.begin(), nums.end());
for(int i = 0;i < nums.size();i ++){
if(i > 0 && nums[i] == nums[i - 1]) continue;
for(int j = i + 1;j < nums.size();j ++){
if(j > i + 1 && nums[j] == nums[j - 1]) continue;
int l = j + 1;
int r = nums.size() - 1;
while(l < r){
long sum = (long)nums[i] + nums[j] + nums[l] + nums[r]; // 防止溢出
if (sum == target) {
res.push_back(vector<int>{nums[i], nums[j], nums[l], nums[r]});
while(l < r && nums[l] == nums[l + 1]) l ++;
while(l < r && nums[r] == nums[r - 1]) r --;
l ++;
r --;
}
else if((long)nums[i] + nums[j] + nums[l] + nums[r] < target) l ++;
else if((long)nums[i] + nums[j] + nums[l] + nums[r] > target) r --;
}
}
}
return res;
}
};