请问你知道分布式系统设计模式的分割日志思想么?

分割日志(Segmented Log)

将大文件切分为更容易处理的多个更小的文件。

问题背景

单一的日志文件可能会增长到很大,并且在程序启动时读取从而成为性能瓶颈。老的日志需要定时清理,但是对于一个大文件进行清理操作很费劲。

解决方案

将单一日志切分为多个,日志在达到一定大小时,会切换到新文件继续写。

//写入日志
public Long writeEntry(WALEntry entry) {
    //判断是否需要另起新文件
    maybeRoll();
    //写入文件
    return openSegment.writeEntry(entry);
}

private void maybeRoll() {
    //如果当前文件大小超过最大日志文件大小
    if (openSegment.
            size() >= config.getMaxLogSize()) {
        //强制刷盘
        openSegment.flush();
        //存入保存好的排序好的老日志文件列表
        sortedSavedSegments.add(openSegment);
        //获取文件最后一个日志id
        long lastId = openSegment.getLastLogEntryId();
        //根据日志id,另起一个新文件,打开
        openSegment = WALSegment.open(lastId, config.getWalDir());
    }
}

如果日志做了切分,那么需要快速以某个日志位置(或者日志序列号)定位到某个文件的机制。可以通过两种方式实现:

  • 每一个日志切分文件的名称都是包含特定开头以及日志位置偏移量(或者日志序列号)
  • 每一个日志序列号包含文件名称以及 transaction 偏移。
//创建文件名称
public static String createFileName(Long startIndex) {
    //特定日志前缀_起始位置_日志后缀
    return logPrefix + "_" + startIndex + "_" + logSuffix;
}

//从文件名称中提取日志偏移量
public static Long getBaseOffsetFromFileName(String fileName) {
    String[] nameAndSuffix = fileName.split(logSuffix);
    String[] prefixAndOffset = nameAndSuffix[0].split("_");
    if (prefixAndOffset[0].equals(logPrefix))
        return Long.parseLong(prefixAndOffset[1]);

    return -1l;
}

在文件名包含这种信息之后,读操作就分为两步:

  1. 给定一个偏移(或者 transaction id),获取到大于这个偏移日志所在文件
  2. 从文件中读取所有大于这个偏移的日志
//给定偏移量,读取所有日志
public List<WALEntry> readFrom(Long startIndex) {
    List<WALSegment> segments = getAllSegmentsContainingLogGreaterThan(startIndex);
    return readWalEntriesFrom(startIndex, segments);
}

//给定偏移量,获取所有包含大于这个偏移量的日志文件
private List<WALSegment> getAllSegmentsContainingLogGreaterThan(Long startIndex) {
    List<WALSegment> segments = new ArrayList<>();
    //Start from the last segment to the first segment with starting offset less than startIndex
    //This will get all the segments which have log entries more than the startIndex
    for (int i = sortedSavedSegments.size() - 1; i >= 0; i--) {
        WALSegment walSegment = sortedSavedSegments.get(i);
        segments.add(walSegment);

        if (walSegment.getBaseOffset() <= startIndex) {
            break; // break for the first segment with baseoffset less than startIndex
        }
    }

    if (openSegment.getBaseOffset() <= startIndex) {
        segments.add(openSegment);
    }

    return segments;
}

举例

基本所有主流 MQ 的存储,例如 RocketMQ,Kafka 还有 Pulsar 的底层存储 BookKeeper,都运用了分段日志。

RocketMQ:
image

Kafka:
image

Pulsar存储实现BookKeeper:
image

另外,基于一致性协议 Paxos 或者 Raft 的存储,一般会采用分段日志,例如 Zookeeper 以及 TiDB。

每日一刷,轻松提升技术,斩获各种offer:

image

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
结构型设计模式和行为型设计模式分布式系统中都有广泛的应用。其中,结构型设计模式主要用于解决分布式系统中的通信和数据传输问题,而行为型设计模式则主要用于解决分布式系统中的协作和同步问题。 以下是一些常见的结构型设计模式分布式系统中的应用: 1. 代理模式:在分布式系统中,代理模式可以用于实现远程过程调用(RPC)和远程方法调用(RMI)等功能,从而使得分布式系统中的不同节点之间可以方便地进行通信和数据传输。 2. 适配器模式:在分布式系统中,适配器模式可以用于将不同节点之间的数据格式进行转换,从而使得这些节点可以更加方便地进行数据交换和共享。 3. 桥接模式:在分布式系统中,桥接模式可以用于将不同节点之间的通信协议进行转换,从而使得这些节点可以更加方便地进行通信和数据传输。 以下是一些常见的行为型设计模式分布式系统中的应用: 1. 观察者模式:在分布式系统中,观察者模式可以用于实现分布式事件处理,从而使得不同节点之间可以方便地进行协作和同步。 2. 命令模式:在分布式系统中,命令模式可以用于实现分布式事务处理,从而使得不同节点之间可以方便地进行协作和同步。 3. 状态模式:在分布式系统中,状态模式可以用于实现分布式锁和分布式同步等功能,从而使得不同节点之间可以方便地进行协作和同步。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值