代码随想录阅读笔记-哈希表【两个数组的交集】

DevilHeart灬

已于 2024-03-15 18:02:18 修改

阅读量324

点赞数 9

文章标签：笔记散列表数据结构

于 2024-03-15 17:59:18 首次发布

本文链接：https://blog.csdn.net/weixin_46184703/article/details/136714309

版权

题目

给定两个数组，编写一个函数来计算它们的交集。

349. 两个数组的交集

说明： 输出结果中的每个元素一定是唯一的。我们可以不考虑输出结果的顺序。

提示：

1 <= nums1.length, nums2.length <= 1000
0 <= nums1[i], nums2[i] <= 1000

思路

交集，去重，两个特点天然决定了这道题需要使用哈希表来解决，因为题目给出了两个数组中元素的范围，最大不超过1000，那么看过我上一篇博客的话，大家第一反应一定是使用数组，元素当作索引值，只需要将两个数组每个遍历一遍即可，这里推荐一种哈希数据结构：unordered_set，这个数据结构可以解决很多类似的问题。

注意题目特意说明：输出结果中的每个元素一定是唯一的，也就是说输出的结果的去重的，同时可以不考虑输出结果的顺序，所以可以将结果集设置为一个unordered_set，c++代码如下：

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重
        int hash[1005] = {0}; // 默认数值为0
        for (int num : nums1) { // nums1中出现的字母在hash数组中做记录
            hash[num] = 1;
        }
        for (int num : nums2) { // nums2中出现话，result记录
            if (hash[num] == 1) {
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

时间复杂度: O(m + n)
空间复杂度: O(n)

在此题中大家能看出，如果数组中的数值很少或者很分散，那么建立这个大小为1000的int数组就显得十分浪费，并且此题是告诉了数组数值的范围，那么如果题目没有限制数值大小呢，我们是否有办法解决？

答案是肯定的，此时就要使用另一种结构体了，set ，关于set，C++ 给提供了如下三种可用的数据结构：

std::set
std::multiset
std::unordered_set

std::set和std::multiset底层实现都是红黑树，std::unordered_set的底层实现是哈希表，使用unordered_set 读写效率是最高的，并不需要对数据进行排序，而且还不要让数据重复，所以选择unordered_set。

思路如图所示：

set哈希法

C++代码如下：

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重
        unordered_set<int> nums_set(nums1.begin(), nums1.end());
        for (int num : nums2) {
            // 发现nums2的元素 在nums_set里又出现过
            if (nums_set.find(num) != nums_set.end()) {
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

时间复杂度: O(n + m) m 是最后要把 set转成vector
空间复杂度: O(n)

这里补充一些关于unordered_set的知识

一些常用的构造案例：

std::unordered_set<string> things {16}; // 16 buckets
std::unordered_set<string> words {"one", "two", "three", "four"};// Initializer list
std::unordered_set<string> some_words {++std::begin(words), std::end (words)}; // Range
std::unordered_set<string> copy_wrds {words}; // Copy constructor

上述代码则是使用了第三种创建方法

代码中用到的unordered_set的一些常用成员方法：

成员方法	功能
`find(key)`	查找值为key的元素，如果找到，则返回一个指向该元素的正向迭代器；如果没找到，则返回一个与end()方法相同的迭代器
`end()`	返回指向容器中最后一个元素之后位置的迭代器

注意点

那有人可能问了，遇到哈希问题我直接都用set不就得了，用什么数组啊。

直接使用set 不仅占用空间比数组大，而且速度要比数组慢，set把数值映射到key上都要做hash计算的。

不要小瞧这个耗时，在数据量大的情况，差距是很明显的。

DevilHeart灬

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
代码随想录阅读笔记-哈希表【两个数组的交集】

交集，去重，两个特点天然决定了这道题需要使用哈希表来解决，因为题目给出了两个数组中元素的范围，最大不超过1000，那么看过我上一篇博客的话，大家第一反应一定是使用数组，元素当作索引值，只需要将两个数组每个遍历一遍即可，这里推荐一种哈希数据结构：unordered_set，这个数据结构可以解决很多类似的问题。在此题中大家能看出，如果数组中的数值很少或者很分散，那么建立这个大小为1000的int数组就显得十分浪费，并且此题是告诉了数组数值的范围，那么如果题目没有限制数值大小呢，我们是否有办法解决？
复制链接

扫一扫