一文搞懂一致性哈希（二）

暮雨c

于 2024-06-27 12:12:50 发布

阅读量247

点赞数 9

分类专栏：后端常用技术文章标签：哈希算法算法

本文链接：https://blog.csdn.net/m0_73629745/article/details/140010171

版权

后端常用技术专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文主要是代码篇，如果还不了解原理的同学请移步一文搞懂一致性哈希（一）

关于一致性哈希服务的类定义，该类会作为使用一致性哈希模块的统一入口
在一致性哈希服务类 ConsistentHash 中包含了几个核心成员属性：

• hashRing：哈希环. 内聚了元数据的存储能力. 是一个抽象 interface，由使用方自行实现后完成注入. 项目中也提供了跳表版和 redis 版实现可供选择使用.

• migrator：迁移器，在哈希环中节点数量发生变更时，用于回调完成数据迁移的闭包函数. 由使用方自行定义执行逻辑，完成注入.

• encryptor：哈希编码器. 需要支持将节点、数据映射到哈希环指定位置的寻址能力. 是一个抽象 interface，由使用方自行实现完成注入，项目中提供了默认的 murmur3 版本.

哈希环涉及的方法较多，根据各大类职能拆分如下：

• 并发安全：

• Lock：哈希环加锁

• Unlock：哈希环解锁

• 节点存储管理：

• Add：真实节点入环

• Rem：真实节点出环

• Ceiling：寻找顺时针下一个虚拟节点

• Floor：寻找逆时针上一个虚拟节点

• 真实节点与虚拟节点映射：

• Nodes：全量的真实节点以及虚拟节点个数映射

• AddNodeToReplica：存储真实节点对应的虚拟节点个数

• DeleteNodeToReplica：删除真实节点对应的虚拟节点个数

• Node：查询虚拟节点对应的真实节点列表

• 真实节点与状态数据映射：

• DataKeys：查询一个真实节点下的全量状态数据 key

• AddNodeToDataKeys：添加某个真实节点与状态数据 key 的映射

• DeleteNodeToDataKey：删除真实节点与状态数据 key 的映射

每一个函数的实现的思路步骤都会有注释，大家可以跟着动手敲一下

package consistent_hash

import (
	"context"
	"errors"
	"fmt"
	"strings"
	"sync"
)

// 通过 redis zset 实现一致性哈希
type ConsistentHash struct {
	hashRing  HashRing
	migrator  Migrator
	encryptor Encryptor
	opts      ConsistentHashOptions
}

func NewConsistentHash(hashRing HashRing, encryptor Encryptor, migrator Migrator, opts ...ConsistentHashOption) *ConsistentHash {
	ch := ConsistentHash{
		hashRing:  hashRing,
		migrator:  migrator,
		encryptor: encryptor,
	}

	for _, opt := range opts {
		opt(&ch.opts)
	}

	repair(&ch.opts)
	return &ch
}

// 添加节点需要触发数据迁移
func (c *ConsistentHash) AddNode(ctx context.Context, nodeID string, weight int) error {
	// 1 加全局分布式锁
	if err := c.hashRing.Lock(ctx, c.opts.lockExpireSeconds); err != nil {
		return err
	}

	defer func() {
		_ = c.hashRing.Unlock(ctx)
	}()

	// 2 如果节点已经存在了，直接返回重复创建的错误
	nodes, err := c.hashRing.Nodes(ctx)
	if err != nil {
		return err
	}

	for node := range nodes {
		if node == nodeID {
			return errors.New("repeat node")
		}
	}

	// 3 根据 replicas 配置，计算出使用的虚拟节点个数
	replicas := c.getValidWeight(weight) * c.opts.replicas
	// 4. 将计算得到的 replicas 个数与 nodeID 的映射关系放到 hash ring 中，同时也能标识出当前 nodeID 已经存在
	if err = c.hashRing.AddNodeToReplica(ctx, nodeID, replicas); err != nil {
		return err
	}

	var migrateTasks []func()
	for i := 0; i < replicas; i++ {
		// 5 使用 encryptor，推算出对应的 k 个虚拟节点的数值
		nodeKey := c.getRawNodeKey(nodeID, i)
		virtualScore := c.encryptor.Encrypt(nodeKey)

		// 6 批量执行，将对应的虚拟节点添加到 hash ring 当中
		if err := c.hashRing.Add(ctx, virtualScore, nodeKey); err != nil {
			return err
		}

		// 7 调用 migrateIn 方法，获取到当前这个 virtualScore 的添加操作，会导致有哪些数据需要从哪个节点迁移到哪个节点
		// from: 数据迁移起点的节点 id
		// to: 数据迁移终点的节点 id
		// data: 需要迁移的数据的 key
		from, to, datas, err := c.migrateIn(ctx, virtualScore, nodeID)
		if err != nil {
			return err
		}

		// 无数据需要迁移，则直接跳过
		if len(datas) == 0 {
			continue
		}

		// 创建数据迁移任务，但不是立即执行，而是放在方法返回前统一批量执行
		migrateTasks = append(migrateTasks, func() {
			_ = c.migrator(ctx, datas, from, to)
		})
	}

	c.batchExecuteMigrator(migrateTasks)

	return nil
}

// 删除节点需要触发数据迁移，
// 作为使用方，需要知道，有哪些数据需要完成迁移，从哪里迁移到哪里
func (c *ConsistentHash) RemoveNode(ctx context.Context, nodeID string) error {
	// 1 加全局分布式锁
	if err := c.hashRing.Lock(ctx, c.opts.lockExpireSeconds); err != nil {
		return err
	}

	defer func() {
		_ = c.hashRing.Unlock(ctx)
	}()

	// 2 如果节点不存在，直接返回失败
	nodes, err := c.hashRing.Nodes(ctx)
	if err != nil {
		return err
	}

	var (
		nodeExist bool
		replicas  int
	)
	for node, _replicas := range nodes {
		if node == nodeID {
			nodeExist = true
			replicas = _replicas
			break
		}
	}

	if !nodeExist {
		return errors.New("invalid node id")
	}

	if err = c.hashRing.DeleteNodeToReplica(ctx, nodeID); err != nil {
		return err
	}

	var migrateTasks []func()
	// 3 根据 replicas，计算出使用的虚拟节点个数
	for i := 0; i < replicas; i++ {
		// 4 使用 encryptor，推算出对应的 k 个虚拟节点数值
		virtualScore := c.encryptor.Encrypt(fmt.Sprintf("%s_%d", nodeID, i))
		// 5 批量执行节点删除操作，如果涉及到数据迁移操作，调用 migrator
		from, to, datas, err := c.migrateOut(ctx, virtualScore, nodeID)
		if err != nil {
			return err
		}

		nodeKey := c.getRawNodeKey(nodeID, i)
		if err = c.hashRing.Rem(ctx, virtualScore, nodeKey); err != nil {
			return err
		}

		if len(datas) == 0 {
			continue
		}

		// 创建数据迁移任务，但不是立即执行，而是放在方法返回前统一批量执行
		migrateTasks = append(migrateTasks, func() {
			_ = c.migrator(ctx, datas, from, to)
		})

	}

	c.batchExecuteMigrator(migrateTasks)

	return nil
}

func (c *ConsistentHash) batchExecuteMigrator(migrateTasks []func()) {
	// 执行所有的数据迁移任务
	var wg sync.WaitGroup
	for _, migrateTask := range migrateTasks {
		// shadow
		migrateTask := migrateTask
		wg.Add(1)
		go func() {
			defer func() {
				if err := recover(); err != nil {

				}
				wg.Done()
			}()
			migrateTask()
		}()
	}
	wg.Wait()
}

func (c *ConsistentHash) GetNode(ctx context.Context, dataKey string) (string, error) {
	// 1 加全局分布式锁
	if err := c.hashRing.Lock(ctx, c.opts.lockExpireSeconds); err != nil {
		return "", err
	}

	defer func() {
		_ = c.hashRing.Unlock(ctx)
	}()

	// 1 输入一个数据 key，查询其所属的节点 id
	dataScore := c.encryptor.Encrypt(dataKey)
	ceilingScore, err := c.hashRing.Ceiling(ctx, dataScore)
	if err != nil {
		return "", err
	}

	if ceilingScore == -1 {
		return "", errors.New("no node available")
	}

	nodes, err := c.hashRing.Node(ctx, ceilingScore)
	if err != nil {
		return "", err
	}

	if len(nodes) == 0 {
		return "", errors.New("no node available with empty score")
	}

	// 2 在这个过程中会建立这则数据与节点 id 的映射关系
	if err = c.hashRing.AddNodeToDataKeys(ctx, c.getNodeID(nodes[0]), map[string]struct{}{
		dataKey: {},
	}); err != nil {
		return "", err
	}

	return nodes[0], nil
}

func (c *ConsistentHash) getValidWeight(weight int) int {
	if weight <= 0 {
		return 1
	}

	if weight >= 10 {
		return 10
	}

	return weight
}

func (c *ConsistentHash) getRawNodeKey(nodeID string, index int) string {
	return fmt.Sprintf("%s_%d", nodeID, index)
}

func (c *ConsistentHash) getNodeID(rawNodeKey string) string {
	index := strings.LastIndex(rawNodeKey, "_")
	return rawNodeKey[:index]
}

本文主要学习：小徐先生的编程世界
下篇预告：一文搞懂elasticsearch

暮雨c

关注

9
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
一文搞懂一致性哈希（二）

本文主要是代码篇，如果还不了解原理的同学请移步[一文搞懂一致性哈希（一）](https://blog.csdn.net/m0_73629745/article/details/140008142?spm=1001.2014.3001.5502)
复制链接

扫一扫