HashMap原理学习

最新推荐文章于 2024-09-11 19:53:29 发布

XDpawn

最新推荐文章于 2024-09-11 19:53:29 发布

阅读量113

点赞数

分类专栏：计算机基础知识文章标签：操作系统

原文链接：https://blog.csdn.net/

版权

计算机基础知识专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.补码、反码的基本概念

已知一个数的补码，求原码的操作其实就是对该补码再求补码：

1、如果补码的符号位为“0”，表示是一个正数，其原码就是补码。

2、如果补码的符号位为“1”，表示是一个负数，那么求给定的这个补码的补码就是要求的原码。

3、反码是原码与补码的过度码
例：已知一个补码为11111001，则原码是10000111（-7）。因为符号位为“1”，表示是一个负数，所以该位不变，仍为“1”。其余七位1111001取反后为0000110；再加1，所以是10000111。
计算机中补码与反码的作用：
补码来表示和存储。反码多应用于系统环境设置。

补码：在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理。此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。
**补充：**无论现实世界中的内容是文字、音频、视频等等，想要通过计算机存储、计算或者展示，都需要转换二进制。最简单的一个数字，**想要在计算机中表示出来，就需要通过一定的手段将他转换成二进制。**而这种手段我们称之为编码方式。
反码：反码是数值存储的一种，但是由于补码更能有效表现数字在计算机中的形式，所以多数计算机一般都不采用反码表示数。

2. 数组与链表的区别：

数组：是将元素在内存中连续存储的；它的优点：因为数据是连续存储的，内存地址连续，所以在查找数据的时候效率比较高；它的缺点：在存储之前，我们需要申请一块连续的内存空间，并且在编译的时候就必须确定好它的空间的大小。在运行的时候空间的大小是无法随着你的需要进行增加和减少而改变的，当数据量比较大的时候，有可能会出现越界的情况，数据比较小的时候，又有可能会浪费掉内存空间。在改变数据个数时，增加、插入、删除数据效率比较低。

链表：是动态申请内存空间，不需要像数组需要提前申请好内存的大小，链表只需在用的时候申请就可以，根据需要来动态申请或者删除内存空间，对于数据增加和删除以及插入比数组灵活。还有就是链表中数据在内存中可以在任意的位置，通过指针来关联数据。

数组和链表就拿增加数据来说，数组中增加一个元素，需要移动大量的元素，在内存中空出一个元素的空间，然后将增加的元素放到空出的空间中；而链表就是将链表中最后的一个元素的指针指向新增的元素，在指出新增元素是尾元素就好了。

数组应用场景：
1、数据比较少；
2、经常做的运算是按序号访问数据元素；
3、数组更容易实现，任何高级语言都支持；
4、构建的线性表较稳定。
链表应用场景：
1、对线性表的长度或者规模难以估计；
2、可以频繁做插入删除操作；
3、构建动态性比较强的线性表。

3.HashMap

其他数据结构在新增，查找等基础操作执行性能

数组：采用一段连续的存储单元来存储数据。对于指定下标的查找，时间复杂度为O(1)；通过给定值进行查找，需要遍历数组，逐一比对给定关键字和数组元素，时间复杂度为O(n)，当然，对于有序数组，则可采用二分查找，插值查找，斐波那契查找等方式，可将查找复杂度提高为O(logn)；对于一般的插入删除操作，涉及到数组元素的移动，其平均复杂度也为O(n)

线性链表：对于链表的新增，删除等操作（在找到指定操作位置后），仅需处理结点间的引用即可，时间复杂度为O(1)，而查找操作需要遍历链表逐一进行比对，复杂度为O(n)

二叉树：对一棵相对平衡的有序二叉树，对其进行插入，查找，删除等操作，平均复杂度均为O(logn)。

哈希表：相比上述几种数据结构，在哈希表中进行添加，删除，查找等操作，性能十分之高，不考虑哈希冲突的情况下（后面会探讨下哈希冲突的情况），仅需一次定位即可完成，时间复杂度为O(1)，接下来我们就来看看哈希表是如何实现达到惊艳的常数阶O(1)的。

比如我们要新增或查找某个元素，我们通过把当前元素的关键字通过某个函数映射到数组中的某个位置，通过数组下标一次定位就可完成操作。
　　
这个函数可以简单描述为：存储位置 = f(关键字) ，这个函数f一般称为哈希函数，这个函数的设计好坏会直接影响到哈希表的优劣。举个例子，比如我们要在哈希表中执行插入操作：
插入过程如下图所示
哈希表数据插入过程
在这里插入图片描述
查找操作同理，先通过哈希函数计算出实际存储地址，然后从数组中对应地址取出即可。
哈希冲突：
如果两个不同的元素，通过哈希函数得出的实际存储地址相同怎么办？其实这就是所谓的哈希冲突，也叫哈希碰撞。哈希冲突的解决方案有多种:开放定址法（发生冲突，继续寻找下一块未被占用的存储地址），再散列函数法，链地址法，而HashMap即是采用了链地址法，也就是数组+链表的方式。
在这里插入图片描述
简单来说，HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了解决哈希冲突而存在的，如果定位到的数组位置不含链表（当前entry的next指向null）,那么查找，添加等操作很快，仅需一次寻址即可；如果定位到的数组包含链表，对于添加操作，其时间复杂度为O(n)，首先遍历链表，存在即覆盖，否则新增；对于查找操作来讲，仍需遍历链表，然后通过key对象的equals方法逐一比对查找。所以，性能考虑，HashMap中的链表出现越少，性能才会越好。

当发生哈希冲突并且size大于阈值（capacity*loadFactory(负载因子)）的时候，需要进行数组扩容，扩容时，需要新建一个长度为之前数组2倍的新的数组，然后将当前的Entry数组中的元素全部传输过去，扩容后的新数组长度为之前的2倍，所以扩容相对来说是个耗资源的操作。

为什么扩容一定是2次幂？
HashMap的数组长度一定保持2的次幂，比如16的二进制表示为 10000，那么length-1就是15，二进制为01111，同理扩容后的数组长度为32，二进制表示为100000，length-1为31，二进制表示为011111。从下图可以我们也能看到这样会保证低位全为1，而扩容后只有一位差异，也就是多出了最左位的1，这样在通过 h&(length-1)的时候，只要h对应的最左边的那一个差异位为0，就能保证得到的新的数组索引和老数组索引一致(大大减少了之前已经散列良好的老数组的数据位置重新调换)，个人理解。
在这里插入图片描述
还有，数组长度保持2的次幂，length-1的低位都为1，会使得获得的数组索引index更加均匀

XDpawn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap原理学习

1.补码、反码的基本概念已知一个数的补码，求原码的操作其实就是对该补码再求补码：1、如果补码的符号位为“0”，表示是一个正数，其原码就是补码。2、如果补码的符号位为“1”，表示是一个负数，那么求给定的这个补码的补码就是要求的原码。3、反码是原码与补码的过度码例：已知一个补码为11111001，则原码是10000111（-7）。因为符号位为“1”，表示是一个负数，所以该位不变，仍为“1”。其余七位1111001取反后为0000110；再加1，所以是10000111。计算机中补码与反码的作用：补
复制链接

扫一扫

专栏目录