NameNode的双缓冲机制代码实现

每次请求NameNode修改一条元数据(比如说申请上传一个文件,那么就需要在内存目录树中加入一个文件),都要写一条edits log,包括两个步骤:

  • 写入本地磁盘。
  • 通过网络传输给JournalNodes集群。

NameNode在写edits log时的第一条原则:

必须保证每条edits log都有一个全局顺序递增的transactionId(简称为txid),这样才可以标识出来一条一条的edits log的先后顺序。

那么如果要保证每条edits log的txid都是递增的,就必须得加锁。

每个线程修改了元数据,要写一条edits log的时候,都必须按顺序排队获取锁后,才能生成一个递增的txid,代表这次要写的edits log的序号。

那NameNode是如何保证在高并发的情况,既保证了高性能,又同时保证了命令的有序性呢?下面就引入本文的双缓冲机制

由于Hadoop源码中的双缓冲机制考虑到更多的情况,所以代码阅读起来会比较费劲,本文通过模仿hadoop的实现方式完成Demo代码,方便理解。话不多说,先上流程图:

代码实现:

public class FSEdit {
    long taxid = 0L;
    DoubleBuffer doubleBuffer = new DoubleBuffer();
    //每个线程自己拥有的副本
    ThreadLocal<Long> threadLocal = new ThreadLocal<>();

    //正在同步磁盘的内存块里面最大的一个事务ID号
    long maxTaxid = 0L;

    //后台是否正在执行数据同步到磁盘上
    public boolean isSyncRunning = false;

    boolean isWait =false;
    /**
     * 写元数据日志的核心方法
     * @param log
     */
    public void logEdit(String log) {
        synchronized (this) { //保证线程安全
            taxid++;
            threadLocal.set(taxid); //给每个线程设置一个事务ID号
            EditLog editLog = new EditLog(taxid, log);
            doubleBuffer.write(editLog);//往内存中写日志,加了锁也不会影响性能,能支撑高并发
        } //释放锁

        //没有回锁,这个过程称为分段加锁,提高性能

        //重新加锁,因为刷写磁盘性能低
        logFlush();
    }

    /**
     * 内存数据刷写到磁盘
     */
    private void logFlush() {
        //重新加锁
        synchronized (this){
            if (isSyncRunning) { //true
                //获取当前线程的事务ID
                Long localTaxid = threadLocal.get();
                if (localTaxid <= maxTaxid) { //说明前面有线程在同步了,则不用再同步,直接返回
                    return;
                }
                //代码走到这里,说明localTaxid > maxTaxid,有数据需要被已刷写到磁盘
                if(isWait) { //如果有线程睡眠要执行任务,那也不需要其它线程处理了,直接退出
                    return;
                }
                isWait = true;
                while (isSyncRunning) {
                    try {
                        //wait方法会让出锁,所以其他线程也会拿到锁进入这个方法,
                        this.wait(1000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
                isWait = false;
            }
            //代码走到这里,说明没有正在同步数据
            doubleBuffer.exchange();
            if (doubleBuffer.syncBuffer.size() > 0) {
                maxTaxid = doubleBuffer.getMaxTaxid();
            }
            isSyncRunning = true;
        }//释放锁

        //数据持久化到磁盘,此处比较耗费性能,没有加锁
        doubleBuffer.flush();

        //此处又为分段加锁
        synchronized (this) {
            //修改标志位
            isSyncRunning = false;
            //唤醒await
            this.notifyAll();
        }
    }

    /**
     * 代表一条元数据信息
     */
    public class EditLog {
        //事务ID
        public long taxid;
        public String log;

        public EditLog(long taxid, String log) {
            this.taxid = taxid;
            this.log = log;
        }

        @Override
        public String toString() {
            return "EditLog{" +
                    "taxid=" + taxid +
                    ", log='" + log + '\'' +
                    '}';
        }
    }

    public class DoubleBuffer{
        //写数据缓存
        LinkedList<EditLog> currentBuffer = new LinkedList<>();
        //用来持久化到磁盘的内存
        LinkedList<EditLog> syncBuffer = new LinkedList<>();

        /**
         * 写元数据信息
         * @param log
         */
        public void write(EditLog log) {
            currentBuffer.add(log);
        }

        /**
         * 把数据写到磁盘
         */
        public void flush() {
            for (EditLog log : syncBuffer) {
                //用打印代替写到磁盘
                System.out.println(log);
            }
            //写完后清空空间
            syncBuffer.clear();
        }

        /**
         * 交换内存
         */
        public void exchange() {
            LinkedList<EditLog> tmp = currentBuffer;
            currentBuffer = syncBuffer;
            syncBuffer = tmp;
        }

        /**
         * 获取正在同步数据的内存里面事务ID的最大ID
         * @return
         */
        public long getMaxTaxid() {
            return syncBuffer.getLast().taxid;
        }
    }

}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值