重哈希rehashing

题目:

哈希表容量的大小在一开始是不确定的。如果哈希表存储的元素太多(如超过容量的十分之一),我们应该将哈希表容量扩大一倍,并将所有的哈希值重新安排。假设你有如下一哈希表:

size=3capacity=4

[null, 21, 14, null]
       ↓    ↓
       9   null
       ↓
      null

哈希函数为:

int hashcode(int key, int capacity) {
    return key % capacity;
}

这里有三个数字9,14,21,其中21和9共享同一个位置因为它们有相同的哈希值1(21 % 4 = 9 % 4 = 1)。我们将它们存储在同一个链表中。

重建哈希表,将容量扩大一倍,我们将会得到:

size=3capacity=8

index:   0    1    2    3     4    5    6   7
hash : [null, 9, null, null, null, 21, 14, null]

给定一个哈希表,返回重哈希后的哈希表。

在线评测地址: http://www.lintcode.com/problem/rehashing/

 

我这人看题目看了好久,没看懂,最后是看着别人的代码才知道是干啥呢,我把代码添加了注释为了以后看的时候能够记住。

希望我能持之以恒吧!

public ListNode[] rehashing(ListNode[] hashTable) {//入参为一个链表数组
        if (hashTable.length <= 0) { //小于零或者等于零时直接返回原数组
            return hashTable;
        }
        int newcapacity = 2 * hashTable.length;//求出扩容后的数组长度,就是乘以2
        ListNode[] newTable = new ListNode[newcapacity];
        for (int i = 0; i < hashTable.length; i++) {//循环原链表数组的每一个链表
            while (hashTable[i] != null) { //直到链表的节点为空时跳出循环,初次是链表的第一个节点
            	//此方法为求出当前链表的节点的值为负数时,也能得出正数的哈希值
                int newindex = (hashTable[i].val % newcapacity + newcapacity) % newcapacity;
                if (newTable[newindex] == null) {		//新数组的newindex的位置为空时,也就是还没有链表生成时
                    newTable[newindex] = new ListNode(hashTable[i].val);//创建一个链表节点,节点的值为原数组中的链表节点的值
                } else {
                    ListNode dummy = newTable[newindex]; //如果数组的newindex位置已经有链表节点了
                    while (dummy.next != null) { //我们遍历链表,找到链表的末端
                        dummy = dummy.next;
                    }
                    dummy.next = new ListNode(hashTable[i].val);//在链表的末端添加一个新的链表节点,节点值为原数组的节点的值
                }
                hashTable[i] = hashTable[i].next; //将当前链表的指针指向下一个节点,开始新一轮循环
            }
        }
        return newTable;
    }

我发现给看不太明白的代码添加一些很白痴的注释,会使我很快理解代码。

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Rehashing指的是解决哈希冲突的一种方法,即在哈希表中发生冲突时,使用一个新的哈希函数再次计算哈希值,直到找到一个空槽为止。下面是一种简单的rehashing实现方法: 1. 初始化哈希表,包括表大小和哈希函数 2. 插入元素时,计算哈希值并检查该位置是否已经被占用 3. 如果该位置已经被占用,则使用新的哈希函数计算哈希值,直到找到一个空槽 4. 如果哈希表已满,则需要新分配更大的内存,并且新计算所有元素的哈希值和位置 需要注意的是,rehashing可能会导致性能下降,因为它需要新计算哈希值和移动元素。因此,为了避免频繁rehashing,通常会将哈希表的大小设置为足够大。 ### 回答2: rehashing是一种哈希表的新扩展方法,用于解决哈希冲突。当哈希表中的某个槽位已经被占用,而又有新的元素要插入时,rehashing可以通过新计算哈希值,找到一个新的可用槽位来存储。 具体来说,rehashing的步骤如下: 1. 创建一个新的哈希表,大小通常是原哈希表的两倍。 2. 遍历原哈希表中的每个元素。 3. 对于每个元素,新计算它的哈希值,以确定在新哈希表中的位置。 4. 如果该位置已经被占用,可以采用一些冲突解决策略,例如线性探测法或链地址法,找到一个新的可用位置。 5. 将元素插入到新的哈希表中的对应位置。 6. 复步骤2-5,直到遍历完原哈希表中的所有元素。 7. 丢弃原哈希表,将新哈希表设为当前哈希表。 rehashing的目的是扩展哈希表的容量,以减少哈希冲突,并提高哈希表的性能。通过新计算哈希值,可以尽量保持元素的分散性,使得新哈希表中的数据分布更加均匀。 需要注意的是,rehashing操作可能会导致哈希表中的元素新排列,因此在进行rehashing时,需要确保对哈希表的访问操作暂停,以避免数据丢失或错误访问。此外,rehashing操作可能会消耗较多的时间和内存,因此需要谨慎选择rehashing的时机,以避免性能问题。 ### 回答3: rehashing是一种在散列冲突(hash collision)发生时解决冲突的方法。散列冲突是指在使用散列函数将关键字映射到散列表中时,不同的关键字可能映射到相同的散列值上。在rehashing中,当遇到冲突时,我们会通过新计算散列值并寻找另一个可用的位置来插入冲突的元素。 以下是rehashing的基本步骤: 1. 创建一个具有较大容量的散列表。这是因为rehashing不仅要存储原始的关键字-值对,还需要容纳新插入的冲突元素。 2. 使用散列函数将原始的关键字映射到散列值,并计算其在散列表中的位置。 3. 如果该位置为空,则直接将关键字-值对插入到该位置。 4. 如果该位置已经被占用,则发生了散列冲突。此时,需要新计算散列值,根据一定的逻辑找到另一个可用的位置。 5. 新计算散列值的方法可以采用线性探测(linear probing)、二次探测(quadratic probing)、链地址法(chaining)等。 6. 定位到新的可用位置后,将冲突的元素插入到该位置。 7. 这样,就成功解决了散列冲突,并完成了rehashing的过程。 需要注意的是,rehashing的效率与所选择的散列函数的好坏有很大关系。一个好的散列函数应该能够尽量减小冲突的概率,并将关键字均匀地分布在散列表中。如果选择了一种不合适的散列函数,可能会导致大量的冲突,进而降低散列表的性能。 此外,当散列表中元素的数量超过一定的阈值时,也可以进行rehashing操作,即创建一个更大的散列表,并将原来的关键字-值对新插入到新的散列表中,以提高散列的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值