今天的每日一题是Leetcode705. 设计哈希集合,题意如下:
不使用任何内建的哈希表库设计一个哈希集合(HashSet)。
实现 MyHashSet 类:
void add(key) 向哈希集合中插入值 key 。
bool contains(key) 返回哈希集合中是否存在这个值 key 。
void remove(key) 将给定值 key 从哈希集合中删除。如果哈希集合中没有这个值,什么也不做。
首先我们想到的方法是用一个标记数组标记所有的数字,这种方法虽然能O(1)的实现各种操作。但是这种方法的缺点是需要的空间太大,数据范围多大就得开多大的数组。显然这种方法不是高效率的算法。
我们可以使用折中的方法,数组中每一个地方可以不止放一个数。我们可以把很多数字放在一个固定的区域内,用取余的方法确定每个数的位置。这样我们进行操作时只需要在这个数对应的位置找就可以了。这里我们使用链表来实现。这里取余的值取977是因为使用质数取余可以保证余数的均匀分布,降低冲突率。(具体可参考大佬的文章哈希表除留取余法的桶个数为什么是质数)
c++参考代码:
class MyHashSet {
private:
vector<list<int>> data;
static const int mod = 977;
public:
/** Initialize your data structure here. */
MyHashSet(): data(mod) {}
void add(int key) {
int n=key%mod;
for(auto it=data[n].begin();it!=data[n].end();it++)
{
if((*it)==key)
return ;
}
data[n].push_back(key);
}
void remove(int key) {
int n=key%mod;
for(auto it=data[n].begin();it!=data[n].end();it++)
{
if((*it)==key)
{
data[n].erase(it);
return ;
}
}
}
/** Returns true if this set contains the specified element */
bool contains(int key) {
int n=key%mod;
for(auto it=data[n].begin();it!=data[n].end();it++)
{
if((*it)==key)
return true;
}
return false;
}
};
/**
* Your MyHashSet object will be instantiated and called as such:
* MyHashSet* obj = new MyHashSet();
* obj->add(key);
* obj->remove(key);
* bool param_3 = obj->contains(key);
*/
时间复杂度:O(N/B),其中 N为哈希表中的元素数量,B 为链表的数量。假设哈希值是均匀分布的,则每个链表大概长度为N/B。
参考资料
·力扣官方题解
·啥时候能毕业啊《哈希表除留取余法的桶个数为什么是质数》