【重难点算法题】设计哈希集合、哈希映射

本文介绍了如何设计哈希集合和哈希映射的数据结构,包括哈希函数、冲突处理方法(如链地址法)、扩容策略以及代码实现。重点讲解了链地址法的实现和复杂度分析。
摘要由CSDN通过智能技术生成

Tag

【哈希集合】【哈希映射】【链地址法】【数据结构设计】


题目来源

705. 设计哈希集合

解题思路

在解题之前需要先明确两组概念:

  • 哈希表与散列表
  • 哈希函数与散列函数

上面的每组概念都是等同的,比如,有些资料中会将哈希表称作散列表,这两个概念是完全相同的,都是任意元素到另一个固定数值的映射。哈希表中的哈希函数对应的就是散列表中的散列函数。

为了实现哈希集合这一数据结构,有以下几个关键问题需要解决:

  • 哈希函数:能够将集合中任意元素映射到一个固定范围的整数值,并将该元素存储到整数值对应的的地址上。
  • 处理冲突:由于不同的元素可能映射到相同的整数值,因此需要再整数值出现冲突时处理冲突。通常有以下几种处理方法:
    • 连地址法:为每一个哈希值维护一个链表,将具有相同哈希值的元素都放入这一链表中;
    • 开放地址法:当发现哈希值 h 处发生冲突时,根据某种策略,从 h 出发找到下一个不冲突的位置。例如,一种简单的策略是,不断检查 h+1h+2,…,这些整数对应的位置,如果某一个地址没有发生冲突,则可以将元素映射到第一个没有发生冲突的地址。
    • 再哈希法:当发生哈希冲突后,使用另一个哈希函数产生一个新的哈希地址。
  • 扩容:当哈希元素过多时,冲突的概率就越来越大,有一个衡量的指标叫做填充因子, 填充因子 = 哈希表包含的元素数 位置总数 填充因子 = \frac{哈希表包含的元素数}{位置总数} 填充因子=位置总数哈希表包含的元素数。 一个不错的经验是:当填充因子大于 0.7,就需要调整哈希表的长度,以减少冲突。

方法一:链地址法

我们设置哈希表的大小为 base,接着设计一个简单的哈希函数:hash(x) = x mod basex 为当前需要映射的元素,hash(x) 表示对应的需要加入到哈希集合中的映射值。

我们开辟一个大小为 base 的数组,将每个 x 的映射值放入数组中,并利用「链地址法」解决哈希冲突,于是在实现中数组中的每一个位置实际放的一条链表。

由于我们使用整数除法作为哈希函数,为了尽可能避免冲突,应当将 base 取为一个质数。在这里,我们取 base=769

代码

class MyHashSet {
private:
    vector<list<int>> data;
    static const int base = 769;
    int hash(int key) {
        return key % base;
    }
public:
    MyHashSet(): data(base) {}  // 列表初始化,初始化 data 大小为 base
    
    void add(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it) == key) {
                return;
            }
        }
        data[h].push_back(key);
    }
    
    void remove(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it) == key) {
                data[h].erase(it);
                return;
            }
        }
    }
    
    bool contains(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it) == key) {
                return true;
            }
        }
        return false;
    }
};

/**
 * Your MyHashSet object will be instantiated and called as such:
 * MyHashSet* obj = new MyHashSet();
 * obj->add(key);
 * obj->remove(key);
 * bool param_3 = obj->contains(key);
 */

复杂度分析

时间复杂度: O ( n b ) O(\frac{n}{b}) O(bn)。其中 n n n 为哈希表中的元素数量, b b b 为链表的数量。假设哈希值是均匀分布的,则每个链表大概长度为 n b \frac{n}{b} bn

空间复杂度: O ( n + b ) O(n+b) O(n+b)


类似题目

706. 设计哈希映射


本题是设计一种哈希映射。设计思路和 设计哈希集合 思路基本一致。以下给出两个代码,代码1 是固定哈希表的大小,代码2 是根据哈希表的负载(填充)情况可以动态扩展哈希表的大小,更具一般性,建议仔细阅读并掌握。

关于哈希表的更多知识,可参考 【算法与数据结构】哈希表

代码1

class MyHashMap {
private:
    vector<list<pair<int, int>>> data;
    static const int base = 769;
    static int hash(int key) {
        return key % base;
    }
public:
    MyHashMap():data(base) {}
    
    void put(int key, int value) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                (*it).second = value;
                return;
            }
        }
        data[h].push_back(make_pair(key, value));
    }
    
    int get(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                return (*it).second;
            }
        }
        return -1;
    }
    
    void remove(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                data[h].erase(it);
                return;
            }
        }
    }
};

/**
 * Your MyHashMap object will be instantiated and called as such:
 * MyHashMap* obj = new MyHashMap();
 * obj->put(key,value);
 * int param_2 = obj->get(key);
 * obj->remove(key);
 */

代码2

class MyHashMap {
private:
    int size;           // 键值对数量
    int capacity;       // 哈希表容量
    double loadThres;   // 负载因子阈值
    int extendRatio;    // 扩容倍数
    vector<list<pair<int, int>>> data;

    // hash 函数
    int hash(int key) {
        return key % capacity;
    }

    // 计算负载因子
    double loadFactor() {
        return double(size) / double(capacity);
    }

public:
    // 构造函数
    MyHashMap(): size(0), capacity(8), loadThres(0.7), extendRatio(2), data(capacity) {}

    // 析构函数
    ~MyHashMap() {}

    // 添加键值对
    void put(int key, int val) {
        ++size;
        if (loadFactor() > loadThres) {
            extend();
        }
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                (*it).second = val;
                return;
            }
        }
        data[h].push_back(make_pair(key, val));
    }

    // 查找
    int get(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                return (*it).second;
            }
        }
        return -1;
    }

    // 删除
    void remove(int key) {
        int h = hash(key);
        for (auto it = data[h].begin(); it != data[h].end(); ++it) {
            if ((*it).first == key) {
                data[h].erase(it);
                --size;
                return;
            }
        }
    }

    // 扩容
    void extend() {
        vector<list<pair<int, int>>> dataTmp = data;
        capacity *= extendRatio;
        data.clear();
        data.resize(capacity);
        size = 0;
        for (auto& ele : dataTmp) {
            for (auto it = ele.begin(); it != ele.end(); ++it) {
                put((*it).first, (*it).second);
            }
        }
    }
};

写在最后

如果您发现文章有任何错误或者对文章有任何疑问,欢迎私信博主或者在评论区指出 💬💬💬。

如果大家觉得有些地方需要补充,欢迎评论区交流。

最后,感谢您的阅读,如果有所收获的话可以给我点一个 👍 哦。

  • 14
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wang_nn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值