链接:350. 两个数组的交集 II - 力扣(LeetCode)
题目描述
给你两个整数数组 nums1
和 nums2
,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2] 输出:[2,2]
思路提示
一、 排序+双指针
涉及到了个数组元素比较,考虑先排序再用双指针的方法,两个指针left和right分别指向nums1和nums2,
- 若两元素相等,则存入新建的数组;
- 若一方小,则小的数组指针后移
代码实现
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
//先排序
sort(nums1.begin(),nums1.end());
sort(nums2.begin(),nums2.end());
int left=0,right=0;
vector<int> nums;
while(left<nums1.size()&&right<nums2.size()){
if(nums1[left]==nums2[right]){//元素相等入栈
nums.push_back(nums1[left]);
++left;//指针后移
++right;
}else if(nums1[left]<nums2[right]){//小元素的指针后移
++left;
}else{
++right;
}
}
return nums;
}
};
复杂度分析
- 时间复杂度:O(mlogm+nlogn),其中 m和 n分别是两个数组的长度。对两个数组进行排序的时间复杂度是 O(mlogm+nlogn),遍历两个数组的时间复杂度是 O(m+n),因此总时间复杂度是 O(mlogm+nlogn)。
- 空间复杂度:O(min(m,n)),其中 m 和 n 分别是两个数组的长度。为返回值创建一个数组 intersection,其长度为较短的数组的长度。不过在 C++ 中,我们可以直接创建一个 vector,不需要把答案临时存放在一个额外的数组中,所以这种实现的空间复杂度为 O(1)。
提示:
std::vector
是一个动态数组,它可以根据需要自动调整大小。它提供了一系列的成员函数,其中包括 push_back
,用于向向量的末尾添加元素。
以下是一些常用的函数:
int size = nums.size(); // 获取向量中元素的数量
bool isEmpty = nums.empty(); // 检查向量是否为空
nums.clear(); // 清空向量中的所有元素
int firstElement = nums.front(); // 获取向量中的第一个元素
int lastElement = nums.back(); // 获取向量中的最后一个元素
//at():根据索引返回向量中指定位置的元素,并进行边界检查。
int element = nums.at(2); // 获取向量中索引为2的元素
//insert():在指定位置之前插入一个或多个元素。
nums.insert(nums.begin() + 2, 50); // 在索引为2的位置之前插入元素50
nums.insert(nums.begin() + 3, {60, 70}); // 在索引为3的位置之前插入元素60和70
//erase():删除指定位置的一个或多个元素。
nums.erase(nums.begin() + 2); // 删除索引为2的元素
nums.erase(nums.begin() + 1, nums.begin() + 3); // 删除索引为1和2的元素
//resize():改变向量的大小。
nums.resize(5); // 将向量的大小调整为5,多余的元素会被截断或添加默认值
二、哈希表
由于一个数组中可能出现多个相同的数字,所以可以考虑用哈希表存储数字和出现的次数,对于一个数字,其在交集中出现的次数等于该数字在两个数组中出现次数的最小值。
具体步骤:
- 首先遍历第一个数组,并在哈希表中记录第一个数组中的每个数字以及对应出现的次数;
- 然后遍历第二个数组,对于第二个数组中的每个数字,如果在哈希表中存在这个数字,则将该数字添加到答案,并减少哈希表中该数字出现的次数。
为了降低空间复杂度,首先遍历较短的数组,并在哈希表中记录每个数字以及对应出现的次数,然后遍历较长的数组得到交集。
代码实现
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
if(nums1.size()>nums2.size()){ ///存储小数组
return intersect(nums2,nums1);
}
unordered_map<int,int> hash;
vector<int> result;
for(int num:nums1){//对应元素个数加一
++hash[num];
}
for(int num:nums2){ //遍历大数组
if(hash.count(num)){ //找到相同元素且个数大于0
result.push_back(num); //相同元素添加到结果数组
if(--hash[num]==0){ //删除,避免重复查找
hash.erase(num);
}
}
}
return result;
}
};
复杂度分析
- 时间复杂度:O(m+n),其中 m 和 n 分别是两个数组的长度。需要遍历两个数组并对哈希表进行操作,哈希表操作的时间复杂度是 O(1),因此总时间复杂度与两个数组的长度和呈线性关系。
- 空间复杂度:O(min(m,n)),其中 m 和 n 分别是两个数组的长度。对较短的数组进行哈希表的操作,哈希表的大小不会超过较短的数组的长度。为返回值创建一个数组 intersection,其长度为较短的数组的长度
结语
从优化的角度思考,如果 nums2
的元素存储在磁盘上,内存是有限的,并且不能一次加载所有的元素到内存中,那么就不能高效地进行排序,哈希表的方法优于排序+双指针,因为哈希表法的nums2只有查询操作,每次只用到部分数据。