分布式内存存储式元数据服务的构建

前言


在前面的文章里(基于状态机方法构建高容错性服务, Apache Ratis的Ratis Server主从同步机制),笔者谈论过如何利用状态机理论来构建replicated server的文章,以此做到服务的高可用性,可做到随时的动态切换。前面文章已经详细阐述里面replicated的原理细节内容,本文笔者打算谈论其中一类特殊的数据服务:纯内存式的replicated server,即In memory的replicated server。纯内存式的数据服务在读写性能上毫无疑问有着极快的响应时间,在实际用途中也有很多的适用场景。下面我们来聊聊这块的内容以及对此的一个简单代码实现。

内存式元数据服务概述


内存元数据服务,顾名思义,就是将系统的元数据信息全部加载到内存中进行访问。鉴于内存访问速度远远快于磁盘读写速度,因此内存元数据服务有着其固有的一大优势:数据读写快。但是它同样有着相比于磁盘做存储而言的一些劣势,

  • 内存空间有限,不如磁盘空间大,论单节点而言,一个系统服务所在节点的可用内存大的会达到百GB级别,但是磁盘一个节点可达到TB级别。
  • 内存数据转瞬即逝,需要有好的策略定期持久化内存数据出去。

不过回头来看,上百GB级别的内存空间用来做元数据的存储还是足够的,毕竟每个元数据单位空间占据不至于那么大。以HDFS NameNode为例,上100GB的NN内存使用可以容纳2亿级别的block元数据信息了。

通用的简单K-V内存存储的replicated server


如小标题所示,本文笔者想要阐述的是一种较为简单的,纯内存存储的K-V键值对的replicated server。这类replicated server将会提供以下基本的服务要求:

  • 内存存储元数据数据,操作响应时间短
  • K-V存储的使用方式,对用户友好,易于使用
  • 对上层应用提供通用的元数据存储功能
  • 具有replicated server属性,能做到高可用性,错误出现时能做到容灾切换

以下是内存存储replicated server的架构模式图:

在这里插入图片描述

在上图中,MapStore是实质存储KV键值的map存储数据结构,MetaMap是map store的元数据存储集。Client到Replicated Server1连线部分的文字即为Client实际操作的使用命令方式:

put操作 <目标操作map名称> <key名称> <value待存储的值>
get操作 <目标操作map名称> <待取出的key名称>

了解完内存式的replicated server后,我们来了解对此server的一个简单实现,来自于Apache Ratis的JIRA: RATIS-40: Replicated Map

内存式Replicated server的实现


在内存式Replicated server的整个模块实现中,可以进一步划分为client side和server side的实现。

Client side的实现


Client side端的实现相比较Server端要简化许多。在Client端,暴露给用户使用的CLI命令如下所示:

Usage: ratis rmap <command> [<args>]");
Commands:
create <rmap_name> <key_class> <value_class>
put <rmap_name> <key> <value>
get <rmap_name> <key>

这里的rmap即replicated map的意思,map为KV内存键值对存储map,以下是对应crete操作方法:

  private int create(String[] args) throws ClassNotFoundException, IOException {
   
    if (args.length < 3) {
   
      return printUsage();
    }

    // 1)构造replicated map的元信息
    RMapInfo info = RMapInfo.newBuilder()
        .withName(RMapName.valueOf(args[0]))
        .withKeyClass(Class.forName(args[1]))
        .withValueClass(Class.forName(args[2]))
        .build();

    // 2)获取admin接口创建Rmap
    try (Client client = ClientFactory.getClient(new FileQuorumSupplier())
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
ZooKeeper是一个开源的分布式协调服务,它被广泛用于构建可靠的分布式系统。虽然它本身不是一个分布式存储系统,但它可以用于实现分布式存储。 在分布式存储中,ZooKeeper可以被用作协调服务,在存储节点之间提供一致性和可靠性的保证。以下是一些使用ZooKeeper实现分布式存储的常见方: 1. 数据元信息管理:ZooKeeper可以用于管理分布式存储系统中的数据元信息,例如存储节点的状态、拓扑结构、数据分片等。通过在ZooKeeper中存储这些元信息,系统可以实现动态的节点管理和数据路由。 2. Leader选举:在一些分布式存储系统中,需要选举一个Leader节点来负责协调其他节点的工作。ZooKeeper提供了一种基于ZAB(ZooKeeper Atomic Broadcast)协议的Leader选举机制,可以确保只有一个节点被选为Leader,从而实现数据一致性和可靠性。 3. 分布式锁:在分布式存储系统中,经常需要对共享资源进行访问控制,以避免数据的竞争和冲突。ZooKeeper提供了一种称为临时有序节点(EPHEMERAL_SEQUENTIAL)的特性,可以用于实现分布式锁。通过在ZooKeeper中创建临时有序节点,并通过节点的顺序来决定锁的获取顺序,可以实现分布式环境下的互斥访问。 4. Watch机制:ZooKeeper支持Watch机制,可以让应用程序在某个节点状态发生变化时得到通知。这个机制可以被用来实现分布式存储系统中的事件触发和通知机制,例如数据更新、节点状态变化等。 总之,ZooKeeper提供了一些基本的协调服务和机制,可以被应用于实现分布式存储系统中的一些关键功能。通过利用ZooKeeper的这些特性,开发者可以构建可靠、高效的分布式存储系统。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值