如何求集合之间的交集(重复元素)

题目类型

已知两个或者多个集合,求他们的交集。

也就是集合之间公共的元素。

解题方法

并查集:

利用并查集,对集合中出现的各种元素进行数量统计。然后再查询验证,选出每个集合都出现过的元素。

这里会有一个是使用map还是undered_map的选择,可以参考一下这篇文章c++中map与unordered_map的区别

排序+双指针

先将集合中的元素(一般是数字)进行排序,然后通过指针对集合进行遍历。如果指针指向的元素相同,即为交集中的元素,如果不相同,则将指针后移。

两种方法的比较

如果内存有限,当集合比较大时,无法将其元素全部读取到内存中,这时就应该采用并查集,因为用并查集进行查询时,我们不用将集合中所有元素全度读取出来,只需要在验证的时候再读取就行了。
但是排序的话就不行了,需要将所有元素全部读取到内存中才能进行排序。

不过两种方法都只适合只有两三个集合的情况,如果集合过多,使用这两种方法会比较麻烦。

例题

上面的方法说明有些抽象,用一个例题具体说明吧!
力扣350.两个数组的交集 II
例题
并查集:

class Solution {
public:
    vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
    	//保证nums1长度比nums2长度要小
        if(nums1.size() > nums2.size()) 
            return intersect(nums2,nums1);

		//创建并查集
        unordered_map<int,int> m;
        //创建向量存储答案
        vector<int> ans;

		//先用一个循环遍历nums1,统计在nums1中出现过的数字
        for(int num : nums1){
            m[num]++;
        }
        //再用一个循环,遍历nums2
        for(int num : nums2){
        	//判断nums中的数字在nums1中是否出现
            if(m[num]) 
            {
                ans.push_back(num);
                m[num]--;//保证出现次数相同
            }
            if(m[num]==0)
                m.erase(num);
        }
        return ans;
    }
};

排序+双指针:

class Solution {
public:
    vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
        int len1 = nums1.size();
        int len2 = nums2.size();
        //创建向量存放答案
        vector<int> ans;
        if(len1 == 0 || len2 == 0) return ans;
        //利用sort函数对nums1和nums2进行排序
        sort(nums1.begin(),nums1.end());
        sort(nums2.begin(),nums2.end());
        //创建两个指针
        int index1 = 0, index2 = 0;
        //遍历两个集合
        while(index1 < len1 && index2 < len2){
        	//当nums1[index1]比nums2[index2]大时,指针一向后移动一位
            if(nums1[index1] < nums2[index2]){
                index1++;
            }
            //当nums1[index1]比nums2[index2]小时,指针二向后移动一位
            else if(nums1[index1] > nums2[index2]){
                index2++;
            }
            //当nums1[index1]比nums2[index2]相等时,将数字存入ans中,然后将两个指针都向后移动一位
            else{
                ans.push_back(nums1[index1]);
                index1++;
                index2++;
            }
        }
        return ans;
    }
};

类似的题目还有力扣349.349. 两个数组的交集
这题与上一题的区别就是不考虑重复的元素。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
交集和并集的线性算法(原创) 对于给定的两个集合,使用哈希表可以在线性时间复杂度内得到他们的交集和并集,具体说明如下: 假设有集合A={1, 7, 5, 13, 9, 10, 11}, B={5, 7, 10, 1, 18, 12}, 1)交集,需要得到结果:A∩B={1, 5, 7,10} 思路如下: ①建立一个哈希表(HashTable),其键(KEY)表示集合中数字的值,其值(VALUE)表示集合中数字出现的次数 ②遍历集合A,将集合中的每个数字(KEY)插入哈希表,每个数字的出现次数(VALUE)设置为1 ③遍历集合B,对于集合中的每个数字: 如果哈希表中已经存在该数字,将对应的VALUE改为2 如果哈希表中不存在该数字,忽略 ④遍历哈希表,输出VALUE为2的数字,即得到A和B的交集 2) 并集,需要得到结果:AUB={1,5,7,9,10,11,12,13,18} 思路如下: ①建立一个哈希表(HashTable),其键(KEY)表示集合中数字的值,其值(VALUE)可以无视 ②遍历集合A,将集合中的每个数字(KEY)插入哈希表 ③遍历集合B,对于集合中的每个数字: 如果哈希表中已经存在该数字,忽略 如果哈希表中不存在该数字,将这个数字插入哈希表 ④遍历哈希表,输出哈希表中的每个KEY,即为A和B的并集 上面以两个集合为例说明了交集和并集的法,事实上,上述算法可以很方便的扩展到3个或3个以上的集合交集并集。另外并集时,由于哈希表的值(VALUE)部分不需要用到,所以这个数据结构也可以更换为 哈希集(HashSet)。 转载请注明出处。 VB中HashTable 2012-08-20 14:43:21| 分类: asp.net|举报|字号 订阅 首先定义一个hashtable Dim hstl As New Hashtable hstl.Add(key, value) 'java是用.put MS开始全面模仿java 这说说vb.net中的hashtable基本用法: 添加值:hstl.add(key,value) 通过key取值: hstl.Item(key).ToString 判断是否含有Key: ContainsKey(key) 判断是否含有value: ContainsValue(value) 遍历hashtable: Dim de As DictionaryEntry '泛型类 For Each de In hstl console.write(de.key & de.value) Next de hashtable不支持通过value取key. 2个集合交集 第一种方法 最简单、粗暴的循环遍历2个集合,判断如果有相同的元素就取出来。假设集合1的长度为M,集合2的长度为N,那么,时间复杂度为:O(M*N) 代码: public static List<string> GetIntersection(List<string> list1, List<string> list2) { List<string> list3 = new List<string>(); //第一种方法:循环遍历 //O(n×m) for (int i = 0; i < list1.Count; i++) { for (int j = 0; j < list2.Count; j++) { if (list1[i]==list2[j]) { list3.Add(list1[i]); } } } return list3; } 第二种方法 利用hash这种很有用的数据结构来实现。我们知道,hash的特点之一就是不允许有重复元素,即hash表中的元素都是唯一的。所以,我们的思路就是:先把第一个集合的所有元素都放进hashSet中,时间复杂度O(M);再把第二个集合中的元素放进hashSet中,如果有重复元素,就是这2个集合交集,时间复杂度为O(N)。即总的时间复杂度从O(M*N)降低到了O(M+N)。 代码: public static List<string> GetIntersection2(List<string> list1, List<string> list2) { //第二种方法:hash List<string> list3 = new List<string>(); HashSet<string> hashSet = new HashSet<string>(); foreach (string item in list1) { hashSet.Add(item); } foreach (string item in list2) { if (hashSet.Add(item) == false) { list3.Add(item); } } return list3; } 测试 代码: static void Main(string[] args) { List<string> list1 = new List<string>(); list1.Add("apple"); list1.Add("banana"); list1.Add("pear"); list1.Add("orange"); list1.Add("grape"); List<string> list2 = new List<string>(); list2.Add("nokia"); list2.Add("sumsung"); list2.Add("htc"); list2.Add("apple"); list2.Add("orange"); List<string> list =new List<string>(); //test for two set join //list = TwoSetsIntersection.GetIntersection(list1, list2); list = TwoSetsIntersection.GetIntersection2(list1, list2); foreach (string item in list) { Console.Write(item + "\t"); } } 总结 hash的另一个特点是查找效率为O(1),惊人的高! 对于这道题目要是算出来O(M*N)的同学就应该补课了。出来混,迟早要还的。 HashSet<T>类 HashSet<T>类主要是设计用来做高性能集运算的,例如对两个集合交集、并集、差集等。集合中包含一组不重复出现且无特性顺序的元素。 HashSet<T>的一些特性如下: 1、HashSet<T>中的值不能重复且没有顺序。 2、HashSet<T>的容量会按需自动添加。 构造方法: HashSet() 默认相等比较器创建一个空的新实例。 HashSet(IEnumerable<T> collection)  把指定集合中的collection中的数据复制到集中 HashSet(IEqualityComparer<T> comparer)  使用指定的相等比较器创建一个空的新实例 HashSet(IEnumerable<T> collection,IEqualityComparer<T> comparer)  使用指定的比较器实例化数据,且将指定集合中的元素复制到集合中。 因为HashSet<T>是专门设计来做集合运算的,因此它提供的方法中有不少是和集合运算相关的。 以下给出它的一些常用方法介绍 成员        类型        说明 Add        方法        将指定的元素添加到集合中 Clear        方法         清空集合中的所有元素 Contains     方法         确定某元素是否在HashSet<T>中 Exists       方法         确定HashSet<T>是否包含于指定条件相匹配的元素 ExceptWith    方法         从当前HashSet<T>移除指定集合中的所有元素 IntersectWith   方法        修改当前的HashSet<T>对象,以仅包含该对象和指定集合中存在的元素 IsProperSubsetOf  方法        确定HashSet<T>对象是否为指定集合的真子集 IsProperSupersetOf 方法        确定HashSet<T>对象是否为指定集合的真超集 IsSunsetOf     方法         确定HashSet<T>对象是否为指定集合的子集 IsSupersetOf    方法         确定HashSet<T>对象是否为指定集合的超集 Remove      方法         从HashSet<T>对象中移除指定的元素 RemoveWhere   方法         从HashSet<T>集合中移除与指定谓词所定义的条件相匹配的所有元素 SetEquals     方法         确定HashSet<T>对象与指定的集合中是否包含相同的元素 SynmmetricExceptWith  方法     修改当前的HashSet<T>对象,以仅包含该对象或指定集合中存在的元素 TrimExcess    方法         将HashSet<T>对象的容量设置为它所包含的元素的实际个数,向上舍入为接近的特性与实现的值。 UnionWith     方法         修改当前的HashSet<T>对象,以包含该对象本身和指定集合中存在的所有元素 给个简单的例子,写不完的,总之记得HashSet<T>主要的作用是用来进行,交集、并集等运算的就OK了。 static void Main(string[] args) { HashSet<string> hs = new HashSet<string>(); hs.Add("你"); hs.Add("好"); hs.Add("吗"); HashSet<string> hs1 = new HashSet<string>(); hs1.Add("你"); hs1.Add("好"); bool b = hs1.IsProperSubsetOf(hs); //确定hs1是否是hs的真子集 Console.WriteLine(b); //输出True HashSet<string> hs2 = new HashSet<string>(); hs2.Add("爱你"); IEnumerable<string> list = hs.Union(hs2); //返回并集 foreach (string str in list) { Console.WriteLine(str); //输出 你 好 吗 爱你 } Console.ReadKey(); }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值