一、题目
给你两个整数数组 nums1 和 nums2 ,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2,2]
示例 2:
输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[4,9]
提示:
- 1 <= nums1.length, nums2.length <= 1000
- 0 <= nums1[i], nums2[i] <= 1000
进阶:
- 如果给定的数组已经排好序呢?你将如何优化你的算法?
- 如果 nums1 的大小比 nums2 小,哪种方法更优?
- 如果 nums2 的元素存储在磁盘上,内存是有限的,并且你不能一次加载所有的元素到内存中,你该怎么办?
二、思路
受Day1 “删除数组中相同元素”的启发,使用双指针法。
先通过这种调用方式确保数组1的长度小于等于数组2的长度
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
if(nums1.size() <= nums2.size())
return getSameElements(nums1,nums2);
else
return getSameElements(nums2,nums1);
}
vector<int> getSameElements(vector<int>& nums1, vector<int>& nums2)
然后对nums1使用双指针的思想进行操作,设一个快指针fast用于遍历nums1,一个慢指针slow用于确定达到我们的要求的可以保留在nums1的元素(本题则是nums2也存在的元素)。
用fast指针去一个个遍历nums1,然后用j指针来逐个遍历nums2——确定nums2中有没有元素等于nums1[fast],如果有,那么slow指针认可该元素,slow指针进行相应的更新;如果没有,则slow指针不管nums1[fast],丢弃它,不进行操作。fast递增指向nums1数组的下一个元素。
当两数组都遍历完成后,最终能够存在nums1的[0,slow)区间段的元素即为答案。
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
if(nums1.size() <= nums2.size())
return getSameElements(nums1,nums2);
else
return getSameElements(nums2,nums1);
}
vector<int> getSameElements(vector<int>& nums1, vector<int>& nums2){//在确保了nums1长度≥nums2的情况下进行找重,避免了“两数组孰大孰小“的复杂讨论
int n1 = nums1.size();
int n2 = nums2.size();
sort(nums1.begin(),nums1.end());
sort(nums2.begin(),nums2.end());//给两数组排序
int fast = 0, slow = 0;//对nums1使用双指针法
int j = 0;//nums2的索引
bool findSame = false;//设置该变量,当找到相同元素时用于跳出循环
while(fast<n1 && j<n2)//当nums1和nums2都未越界时
{
while(j<n2 && nums1[fast]>=nums2[j] && findSame==false)//在nums1[fast]不小于nums2[j]前提下
{
if(j<n2 && findSame==false && nums1[fast]==nums2[j])//如果num1[fast]是num2[]也含有的相同元素
{
nums1[slow] = nums1[fast];//该元素即为所求,加入到慢指针中
slow++;//慢指针更新
findSame = true;//跳出循环
}
j++;//无论nums2[j]小于nums1[fast]还是等于它,j往下递增
}
findSame = false;
fast++;//快指针更新
}//nums1[0,fast)区间段即为所求的共同元素
vector<int> same(slow);
for(int i = 0; i < slow; i++)
same[i] = nums1[i];//将nums1[0,fast)区间段拷贝到新数组中,提交答案
return same;
}
};
补充:在力扣的编译器里似乎不允许nums2[j++]这样的写法,一开始在while循环中这样写
while(j<n2 && nums1[fast]>=nums2[j] && findSame==false)//在nums1[fast]不小于nums2[j]前提下
{
if(j<n2 && findSame==false && nums1[fast]==nums2[j++])//如果num1[fast]是num2[]也含有的相同元素
{
nums1[slow] = nums1[fast];//该元素即为所求,加入到慢指针中
slow++;//慢指针更新
findSame = true;//跳出循环
}
}
会报错,编译器认为溢出(尽管循环条件保证了j不会达到溢出边界n2)。
三、官方解法
方法一:哈希表(哈希map法)
由于同一个数字在两个数组中都可能出现多次,因此需要用哈希表存储每个数字出现的次数。对于一个数字,其在交集中出现的次数等于该数字在两个数组中出现次数的最小值。
首先遍历第一个数组,并在哈希表中记录第一个数组中的每个数字以及对应出现的次数,然后遍历第二个数组,对于第二个数组中的每个数字,如果在哈希表中存在这个数字,则将该数字添加到答案,并减少哈希表中该数字出现的次数。
为了降低空间复杂度,首先遍历较短的数组并在哈希表中记录每个数字以及对应出现的次数,然后遍历较长的数组得到交集。
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
if (nums1.size() > nums2.size()) {
return intersect(nums2, nums1);
}
unordered_map <int, int> m;
for (int num : nums1) {
++m[num];
}
vector<int> intersection;
for (int num : nums2) {
if (m.count(num)) {
intersection.push_back(num);
--m[num];
if (m[num] == 0) {
m.erase(num);
}
}
}
return intersection;
}
};
作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/intersection-of-two-arrays-ii/solution/liang-ge-shu-zu-de-jiao-ji-ii-by-leetcode-solution/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
复杂度分析
- 时间复杂度:O(m+n),其中 m 和 n 分别是两个数组的长度。需要遍历两个数组并对哈希表进行操作,哈希表操作的时间复杂度是 O(1),因此总时间复杂度与两个数组的长度和呈线性关系。
- 空间复杂度:O(min(m,n)),其中 m 和 n 分别是两个数组的长度。对较短的数组进行哈希表的操作,哈希表的大小不会超过较短的数组的长度。为返回值创建一个数组 intersection,其长度为较短的数组的长度。
方法二:排序 + 双指针
(和笔者思路类似,但是比笔者简洁太多!!!!是个非常棒的改进)
如果两个数组是有序的,则可以使用双指针的方法得到两个数组的交集。
首先对两个数组进行排序,然后使用两个指针遍历两个数组。
初始时,两个指针分别指向两个数组的头部。每次比较两个指针指向的两个数组中的数字,如果两个数字不相等,则将指向较小数字的指针右移一位,如果两个数字相等,将该数字添加到答案,并将两个指针都右移一位。当至少有一个指针超出数组范围时,遍历结束。
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
sort(nums1.begin(), nums1.end());
sort(nums2.begin(), nums2.end());
int length1 = nums1.size(), length2 = nums2.size();
vector<int> intersection;
int index1 = 0, index2 = 0;
while (index1 < length1 && index2 < length2) {
if (nums1[index1] < nums2[index2]) {
index1++;
} else if (nums1[index1] > nums2[index2]) {
index2++;
} else {
intersection.push_back(nums1[index1]);
index1++;
index2++;
}
}
return intersection;
}
};
作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/intersection-of-two-arrays-ii/solution/liang-ge-shu-zu-de-jiao-ji-ii-by-leetcode-solution/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
复杂度分析
- 时间复杂度:O(mlogm+nlogn),其中 m 和 n 分别是两个数组的长度。对两个数组进行排序的时间复杂度是O(mlogm+nlogn),遍历两个数组的时间复杂度是O(m+n),因此总时间复杂度是 O(mlogm+nlogn)。
- 空间复杂度:O(min(m,n)),其中 m 和 n 分别是两个数组的长度。为返回值创建一个数组 intersection,其长度为较短的数组的长度。不过在 C++ 中,我们可以直接创建一个 vector,不需要把答案临时存放在一个额外的数组中,所以这种实现的空间复杂度为 O(1)。
结语
如果nums2的元素存储在磁盘上,磁盘内存是有限的,并且你不能一次加载所有的元素到内存中。那么就无法高效地对nums2进行排序,因此推荐使用方法一而不是方法二。在方法一中,nums2只关系到查询操作,因此每次读取nums2中的一部分数据,并进行处理即可。
四、学习心得
1.官方解法一中自己反向调用自己参数的方式,可以确保数组1的长度小于等于数组2的长度
if (nums1.size() > nums2.size()) {
return intersect(nums2, nums1);
}
代码简略易懂。虽然笔者方法中的前几行也起到相同作用,但是答案方法更为简洁!
2.哈希法除了使用set容器进行散列存储不同元素外,还可以使用map容器存储键值互异的元素对pair<>,如本题所示,pair<>中一个用来存数组nums1元素值,另一个用来存储该值对应的次数,map容器能够很好的胜任这个需求。