leetcode 705. design-hashset 设计哈希集合 python3

时间:2020-8-25

题目地址:

https://leetcode-cn.com/problems/design-hashset/

题目难度:

Easy

题目描述:

不使用任何内建的哈希表库设计一个哈希集合

具体地说,你的设计应该包含以下的功能

add(value):向哈希集合中插入一个值。
contains(value) :返回哈希集合中是否存在这个值。
remove(value):将给定值从哈希集合中删除。如果哈希集合中没有这个值,什么也不做。

示例:

MyHashSet hashSet = new MyHashSet();
hashSet.add(1);         
hashSet.add(2);         
hashSet.contains(1);    // 返回 true
hashSet.contains(3);    // 返回 false (未找到)
hashSet.add(2);          
hashSet.contains(2);    // 返回 true
hashSet.remove(2);          
hashSet.contains(2);    // 返回  false (已经被删除)

注意:

所有的值都在 [0, 1000000]的范围内。
操作的总数目在[1, 10000]范围内。
不要使用内建的哈希集合库。


思路1:使用字典,手写哈希函数,解决冲突用的顺序数组法,干就完了

tips:集合内元素不可重复,所以在增加的时候需要判断一下

代码段1:通过

class MyHashSet:

    def __init__(self):
        """
        Initialize your data structure here.
        """
        self.hash_size = 769
        self.hash_set = {_:[] for _ in range(self.hash_size)}

    def add(self, key: int) -> None:
        if key not in self.hash_set[key % 769]:
            self.hash_set[key % 769].append(key)

    def remove(self, key: int) -> None:
        if key in self.hash_set[key % 769]:
            self.hash_set[key % 769].remove(key)
        
    def contains(self, key: int) -> bool:
        """
        Returns true if this set contains the specified element
        """
        if key not in self.hash_set[key % 769]:
            return False
        else:
            return True

# Your MyHashSet object will be instantiated and called as such:
# obj = MyHashSet()
# obj.add(key)
# obj.remove(key)
# param_3 = obj.contains(key)

总结:

  1. 虽然写的比较low,但是好久不写了,第一次通过还是很开心的,哈希的基础还是在的

  2. 哈希函数的共同特点是使用模运算符。\text{hash} = \text{value} \mod \text{base}hash=valuemodbase。其中,\text{base}base 将决定 HashSet 中的桶数。

    从理论上讲,桶越多(因此空间会越大)越不太可能发生碰撞。\text{base}base 的选择是空间和碰撞之间的权衡。

    此外,使用质数作为 \text{base}base 是一个明智的选择。例如 769,可以减少潜在的碰撞。

  3. 相关知识

    为了实现 HashSet 数据结构,有两个关键的问题,即哈希函数和冲突处理。

    哈希函数:目的是分配一个地址存储值。理想情况下,每个值都应该有一个对应唯一的散列值。
    冲突处理:哈希函数的本质就是从 A 映射到 B。但是多个 A 值可能映射到相同的 B。这就是碰撞。因此,我们需要有对应的策略来解决碰撞。总的来说,有以下几种策略解决冲突:
    单独链接法:对于相同的散列值,我们将它们放到一个桶中,每个桶是相互独立的。
    开放地址法:每当有碰撞, 则根据我们探查的策略找到一个空的槽为止。
    双散列法:使用两个哈希函数计算散列值,选择碰撞更少的地址。

  4. 【2020-08-26】更新:这其实都是错的,直接使用内建的哈希库,重写了数组,为啥感觉怪怪的

class Bucket:
    def __init__(self):
        self.bucket = []
    
    def update(self, key:int) -> None:
        if key not in self.bucket:
            self.bucket.append(key)

    def remove(self, key: int) -> None:
        if key in self.bucket:
            self.bucket.remove(key)
    
    def contains(self, key: int) ->bool:
        if key in self.bucket:
            return True
        else:
            return False

class MyHashSet:
    def __init__(self):
        """
        Initialize your data structure here.
        """
        self.hash_size = 769
        self.hash_set = [Bucket() for _ in range(self.hash_size + 1)]

    def add(self, key: int) -> None:
        hash_key = key % self.hash_size
        self.hash_set[hash_key].update(key)

    def remove(self, key: int) -> None:
        hash_key = key % self.hash_size
        self.hash_set[hash_key].remove(key)
        
    def contains(self, key: int) -> bool:
        """
        Returns true if this set contains the specified element
        """
        hash_key = key % self.hash_size
        return self.hash_set[hash_key].contains(key)

# Your MyHashSet object will be instantiated and called as such:
# obj = MyHashSet()
# obj.add(key)
# obj.remove(key)
# param_3 = obj.contains(key)

后续优化:用链表和二叉搜索树

https://leetcode-cn.com/problems/design-hashset/solution/she-ji-ha-xi-ji-he-by-leetcode/

链地址法https://leetcode-cn.com/problems/design-hashset/solution/python-lian-di-zhi-fa-by-qqqun902025048/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值