java学习笔记_进阶012

哈希表/散列表数据结构

HashMap集合:

  • HashMap集合底层是哈希表/散列表的数据结构

  • 哈希表是一个怎样的数据结构?

    • 哈希表是一个数组单向链表结合体
    • 数组:在查询方面效率很高,随机增删方面的效率很低
    • 单向链表:在随机增删方面效率较高,而在查询方面效率很低
    • 哈希表将以上的两种数据结构融合在一起,充分发挥它们各自的优点
    • 哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法,可以转换存储成数组的下标
    • 同一个单向链表上所有节点的hash相同,因为他们的数组下标是一样的。但同一个链表上k和k的equals方法肯定返回的是false,都不相等。
    • hashCode()方法需要重写,在重写时返回一个固定值的话,会把所有的对象均写到一个单向链表上。
    • 放在HashMap集合key部分的元素,以及放在HashSet集合中的元素,需要同时重写hashCode和equals方法
  • 如何存的put(k,v) 和取的get(k)的方法的实现原理,是必须要掌握的

    • map.put(k,v)实现原理
      • 第一步:先将k,v封装到Node对象中
      • 第二步:底层会调用k的hashCode()方法得出hash值,然后通过哈希函数/哈希算法,将hash值转换成数组的下标。下标位置上如果没有任何元素,就把Node添加到这个位置上了。如果说下标对应的位置上有链表,此时会拿着k和链表上每一个节点中的k进行equals,如果所有的equals方法返回都是false,那么这个新节点将会被添加到链表的末尾。如果其中有一个equals方法返回了true,那么这个节点的value将会被覆盖
    • v = map.get(k)实现原理
      • 先调用k的hashCode方法得出哈希值,通过哈希算法转换成数组下标,通过数组下标快速定位到某个位置上,如果这个位置上什么也没有,返回null.如果这个位置上有单向链表,那么会拿着参数k和单向链表上的每个节点中的k进行equals。如果所有equals方法返回false,那么get方法返回null.只要其中有一个节点的k和参数k equals的时候返回true,那么此时这个节点的value就是我们要找的value,get方法最终返回这个要找的value
  • 为什么哈希表的随机增删以及查询效率都很高

    • 增删是在链表上完成
    • 查询也不需要都扫描,只需要部分扫描
  • 结论:

    • 可以得出HashMap集合的key,会先后调用两个方法,一个方法是hashCode(),一个方法是equals(),这2个方法需要重写(因为equals默认比较的是两个对象的内存地址,而我们应该比较的是内容
  • HashMap集合的key部分特点:

    • 无序,不可重复
    • 为什么无序?
      • 因为不一定挂到哪个单向链表上
    • 不可重复是怎么保证的?
      • equals方法来保证HashMap集合的key不可重复。如果key重复了,value会覆盖
    • 放在HashMap集合key部分的元素其实就是放到HashSet集合中了。所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法
  • 哈希表HashMap使用不当时无法发挥性能

    • 假设将所有的hashCode()方法返回值固定为某个值,那么会导致底层哈希表变成了纯单向链表。这种情况我们称为:散列分布不均匀
      • 什么是散列分布均匀
        • 假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的,是散列分布均匀的
    • 假设将所有的hashCode()方法返回值都设定为不一样的值,那么会导致底层哈希表变成了一维数组,美哟链表概念,也是:散列分布不均匀
      • 散列分布均匀需要你重写hashCode()方法时有一定的技巧
  • HashMap集合的默认初始化容量是16,默认加载因子是0.75。这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候,数组开始扩容。

  • HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,这是因为达到散列均匀,为了提高HashMap集合的存储效率而必须的

  • 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后再调用equals方法

    • equals方法有可能调用,也有可能不调用
      • 拿put(k,v)举例,什么时候equals不会调用?
        • k.hashCode()方法返回哈希值,哈希值经过哈希算法转换成数组下标,数组下标位置商如果是null,euqals不需要执行
      • 拿get(k)举例,什么时候equals不会调用?
        • 如果单向链表上只有1个元素时。不需要调用equals方法
        • 数组下标位置上如果是null,equals不需要执行
  • 如果一个类的equals方法重写了,那么hashCode()也要重写。并且equals方法返回如果是true,hashCode()方法返回的值必须一样

    • equqls方法返回true表示两个对象相同,在同一个单向链表上比较。那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。,所以
      hashCode()方法返回值相同
    • hashCode()方法和equals()方法不用研究,直接使用IDEA工具生成,但是这两个方法需要同时生成。
  • 终极结论

    • 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法
  • HashMap

    • 在JDK8之后,如果哈希表单向链表中元素超过8个,单向链表这种数据结构会变成红黑树数据结构。
    • 当红黑树上的节点数量小于6时,会重新把红黑树变成单向链表数据结构。这种方式也是为了提高检索效率,二叉树的检索会再次缩小扫描范围。提高效率。初始化容量16,默认加载因子0.75
  • 对于哈希表数据结构来说

    • 如果o1和o2的hash值相同,一定是放到同一个单向链表上
    • 当然如果o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标可能相同,此时会发生“哈希碰撞”
  • HashMap集合key部分允许null

    • HashMap集合的key,null值只能有一个
    • HashMap的key和value都是可以null
  • Hashtable的key和value都是不能为null的

  • Hashtable方法都带有synchronized;线程安全的;线程安全有其它的方案,这个Hashtable对线程的处理导致效率较低,使用较少了

  • Hashtable和HashMap一样,底层都是哈希表数据结构

  • HashMap集合的初始化容量16,默认加载因子0.75.扩容,扩容之后的容量是原容量的2倍

  • Hashtable的初始化容量是11,默认加载因子为0.75f.Hashtable集合扩容是:原容量2+1

  • HashSet集合的初始化容量16,初始化容量建议是2的倍数。扩容:扩容之后是原容量2倍

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

__BC__

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值