【JAVA】处理哈希冲突的常见方法

还在路上的秃头

已于 2024-01-16 16:50:11 修改

阅读量3.2k

点赞数 19

分类专栏： JAVA 文章标签：哈希算法算法散列表

于 2023-12-05 11:56:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AliceNo/article/details/134803535

版权

JAVA 专栏收录该内容

50 篇文章 0 订阅

订阅专栏

🍎个人博客：个人主页

🏆个人专栏：JAVA

⛳️ 功不唐捐，玉汝于成

目录

1. 开放寻址法（Open Addressing）：

2. 链地址法（Chaining）：

3. 其他方法：

再哈希（Rehashing）：

完全随机化哈希函数：

哈希桶分割：

我的其他博客

前言

在设计和实现哈希表时，我们面临着一个重要的问题，即哈希冲突。哈希冲突发生在不同的键映射到相同的哈希桶位置时，这可能导致数据的丢失或者影响哈希表的性能。因此，解决哈希冲突是构建高效、稳定哈希表的关键一环。在面对哈希冲突时，我们需要采用一些巧妙的方法来保证数据的唯一性、高效的查找和插入操作。下面将介绍几种常见的解决哈希冲突的方法，包括开放寻址法、链地址法以及其他一些策略。

正文

哈希冲突的解决方法主要分为两大类：开放寻址法和链地址法。以下是这两大类中的一些具体方法：

1. 开放寻址法（Open Addressing）：

线性探测（Linear Probing）： 如果哈希桶中的位置已经被占用，就线性地往后寻找下一个可用的位置。
二次探测（Quadratic Probing）： 在发生冲突时，通过二次方程来寻找下一个可用的位置，以减小探测的步长。
双重散列（Double Hashing）： 使用两个哈希函数，如果发生冲突，就通过第二个哈希函数来计算下一个位置。

代码：

public class LinearProbingHashTable {
    private int size;
    private String[] table;

    public LinearProbingHashTable(int capacity) {
        size = 0;
        table = new String[capacity];
    }

    public void insert(String key) {
        int index = hashFunction(key);
        while (table[index] != null) {
            index = (index + 1) % table.length; // 线性探测
        }
        table[index] = key;
        size++;
    }

    public boolean search(String key) {
        int index = hashFunction(key);
        while (table[index] != null) {
            if (table[index].equals(key)) {
                return true;
            }
            index = (index + 1) % table.length; // 线性探测
        }
        return false;
    }

    private int hashFunction(String key) {
        // 实现哈希函数的逻辑
        return key.hashCode() % table.length;
    }
}

2. 链地址法（Chaining）：

基本链地址法： 哈希桶中的每个位置都是一个链表的头节点，当发生冲突时，将新的元素添加到链表中。
使用平衡树的链地址法： 链表可以替换成平衡二叉树或其他数据结构，以提高性能。
Cuckoo Hashing： 使用两个哈希函数和两个哈希表，当发生冲突时，按照两个哈希函数的结果在两个表中进行插入，如果产生循环则重新哈希。

代码

import java.util.LinkedList;

public class ChainingHashTable {
    private int size;
    private LinkedList<String>[] table;

    public ChainingHashTable(int capacity) {
        size = 0;
        table = new LinkedList[capacity];
        for (int i = 0; i < capacity; i++) {
            table[i] = new LinkedList<>();
        }
    }

    public void insert(String key) {
        int index = hashFunction(key);
        table[index].add(key);
        size++;
    }

    public boolean search(String key) {
        int index = hashFunction(key);
        return table[index].contains(key);
    }

    private int hashFunction(String key) {
        // 实现哈希函数的逻辑
        return key.hashCode() % table.length;
    }
}

3. 其他方法：

再哈希（Rehashing）：

当哈希表达到一定的负载因子时，扩展哈希表的大小，然后重新哈希已有的元素。

代码：

import java.util.Arrays;

public class RehashingHashTable {
    private static final double LOAD_FACTOR_THRESHOLD = 0.7;
    private int size;
    private String[] table;

    public RehashingHashTable(int initialCapacity) {
        size = 0;
        table = new String[initialCapacity];
    }

    public void insert(String key) {
        if ((double) size / table.length > LOAD_FACTOR_THRESHOLD) {
            rehash();
        }

        int index = hashFunction(key);
        while (table[index] != null) {
            index = (index + 1) % table.length;
        }
        table[index] = key;
        size++;
    }

    private void rehash() {
        int newCapacity = table.length * 2;
        String[] newTable = new String[newCapacity];

        for (String key : table) {
            if (key != null) {
                int index = hashFunction(key);
                while (newTable[index] != null) {
                    index = (index + 1) % newTable.length;
                }
                newTable[index] = key;
            }
        }

        table = newTable;
    }

    private int hashFunction(String key) {
        // 实现哈希函数的逻辑
        return key.hashCode() % table.length;
    }
}

完全随机化哈希函数：

通过使用随机化的哈希函数来减小冲突的概率。

代码：

import java.util.Random;

public class RandomizedHashFunction {
    private static final int PRIME_NUMBER = 31; // 用于构建复杂哈希函数的质数
    private int size;
    private String[] table;

    public RandomizedHashFunction(int capacity) {
        size = 0;
        table = new String[capacity];
    }

    public void insert(String key) {
        int index = randomizedHashFunction(key);
        while (table[index] != null) {
            index = (index + 1) % table.length;
        }
        table[index] = key;
        size++;
    }

    private int randomizedHashFunction(String key) {
        Random random = new Random();
        int hash = 0;
        for (char c : key.toCharArray()) {
            hash = (hash * PRIME_NUMBER + c) % table.length;
        }
        return hash;
    }
}

哈希桶分割：

将哈希表分成若干个桶，每个桶都是一个小的哈希表，可以独立进行扩展和收缩。

代码：

import java.util.ArrayList;
import java.util.List;

public class HashBucketSplitting {
    private List<String>[] buckets;
    private static final int INITIAL_BUCKET_COUNT = 10;

    public HashBucketSplitting() {
        buckets = new List[INITIAL_BUCKET_COUNT];
        for (int i = 0; i < INITIAL_BUCKET_COUNT; i++) {
            buckets[i] = new ArrayList<>();
        }
    }

    public void insert(String key) {
        int index = hashFunction(key);
        buckets[index].add(key);
    }

    public boolean search(String key) {
        int index = hashFunction(key);
        return buckets[index].contains(key);
    }

    private int hashFunction(String key) {
        // 实现哈希函数的逻辑
        return key.hashCode() % buckets.length;
    }
}

选择哪种方法取决于具体的应用场景、性能需求和数据特性。每种方法都有其优势和劣势，需要根据具体情况进行选择。

结语

解决哈希冲突是哈希表设计中不可忽视的重要问题。选择合适的冲突解决策略直接影响了哈希表的性能和稳定性。开放寻址法通过在哈希表中寻找新的空位置来解决冲突，而链地址法则通过在冲突位置构建链表等数据结构来存储冲突的元素。另外，再哈希、完全随机化哈希函数和哈希桶分割等方法也为我们提供了在不同场景下解决哈希冲突的有效手段。

我的其他博客

【MySQL】数据库规范化的三大法则 — 一探范式设计原则-CSDN博客

【JAVA】线程的run()和start()有什么区别？-CSDN博客

【日常聊聊】程序员必备的面试技巧：如何在面试战场上脱颖而出-CSDN博客

【JAVA】Java8开始ConcurrentHashMap,为什么舍弃分段锁-CSDN博客

【JAVA】怎么确保一个集合不能被修改-CSDN博客

【Web开发】会话管理与无 Cookie 环境下的实现策略-CSDN博客

【Mybatis】Mybatis如何防止sql注入-CSDN博客

【软件工程】航行敏捷之路：深度解析Scrum框架的精髓-CSDN博客

【Spring】理解IoC与AOP：构建灵活而模块化的软件架构-CSDN博客

还在路上的秃头

关注

19
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
0
评论
【JAVA】处理哈希冲突的常见方法

在设计和实现哈希表时，我们面临着一个重要的问题，即哈希冲突。哈希冲突发生在不同的键映射到相同的哈希桶位置时，这可能导致数据的丢失或者影响哈希表的性能。因此，解决哈希冲突是构建高效、稳定哈希表的关键一环。在面对哈希冲突时，我们需要采用一些巧妙的方法来保证数据的唯一性、高效的查找和插入操作。下面将介绍几种常见的解决哈希冲突的方法，包括开放寻址法、链地址法以及其他一些策略。解决哈希冲突是哈希表设计中不可忽视的重要问题。选择合适的冲突解决策略直接影响了哈希表的性能和稳定性。
复制链接

扫一扫

专栏目录

还在路上的秃头 CSDN认证博客专家 CSDN认证企业博客

码龄3年

Java新星领域创作者

290: 原创

3万+: 周排名

3685: 总排名

56万+: 访问

: 等级

8040: 积分

3209: 粉丝

4460: 获赞

482: 评论

3388: 收藏

私信

关注

热门文章

分类专栏

Kotlin 1篇
JAVA 50篇
并发编程 8篇
JVM 6篇
前端 6篇
Linux 20篇
软件安装以及使用 7篇
git 1篇
Redis 11篇
spring 8篇
Mybatis 9篇
刷题心得 18篇
软件工程 16篇
并发编程 1篇
多线程 1篇
计算机网络 12篇
Web开发 7篇
数据库 20篇
常见的一些错误 7篇
数据结构 9篇
树 2篇
日常聊聊 59篇
分布式 2篇

最新评论

【Kotlin】简单介绍与使用kotlin
空空bye: 这篇文章内容丰富，信息量大！作者在解释每个知识点时，力求详尽清晰，使读者能够轻松理解和掌握。此外，文章引用了一些具有代表性的代码片段，不仅展示了编程的魅力，还帮助读者更好地理解相关概念和技巧。
【Kotlin】简单介绍与使用kotlin
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618784672。
什么是粘包？造成粘包的原因，解决它的方法
是Yu欸: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！
什么是粘包？造成粘包的原因，解决它的方法
染念: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。
程序员的副业指南：如何利用技能赚取额外收入
是Yu欸: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

还在路上的秃头 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。