一、hash算法的一些基础知识
概念:hash算法根据一个数的值通过hash函数来确定其存储的位置,尽可能的达到存储和查找都能是O(1)的复杂度
计算hash函数的几种方法:
1、直接取值法
取关键数的某个线性函数作为存储位置
2、取模寻址法
将关键值除以一个固定数,获取余数作为存储位置
但是这两种方法都存在一定的冲突问题,所以需要一些解决冲突的方法:
1、开放寻址法
当存在冲突时,根据获取到的存储位置,顺序寻找不超过hash表长度的存储位置
2、拉链法
将存在冲突的关键值,存储的一个链表中,来解决冲突
二、hash算法应用场景
1、请求的负载均衡
根据客户端的ip地址或者路径或者参数,获取到hash值,分配到hash值对应的服务器中
2、分布式存储
使用hash算法计算出要存储数据的位置节点
三、普通hash带来的问题
使用普通hash时,当进行扩缩容时,关键值对应的请求或者存储的路径会发生变化,产生一些不必要的问题,因此我们可以使用hash环来尽量的减少出现的问题。
四、hash环
将服务器节点或者存储数据的节点映射到一个hash环中,当要请求数据或者存储数据,通过计算的到的hash值顺时针去查找hash环中服务器的位置
假设此时服务器节点2,挂了之后,那么hash值1的请求路径发生了变化,顺时针查找到服务器节点1,而hash值2和hash值3的请求路径不发生变化
此时,也存在一个问题,当hash环中的服务器较少时,而服务器在hash环中位置分配不均匀时,就会发生一个服务器要处理大量请求的情况,例如:
面对这种情况,我们可以使用虚拟的节点映射真正的服务器的位置,来尽可能的达到均匀的映射服务器的位置。
5)]
面对这种情况,我们可以使用虚拟的节点映射真正的服务器的位置,来尽可能的达到均匀的映射服务器的位置。