HDFS学习笔记4 -- Centralized Cache技术

  对于高频率使用的数据,用户可以将其放人某文件夹,然后向各个DataNode发出指示将其中的数据缓存在内存里。这种情况下,用户还可以利用一组zero-copy的API,同时由于不再需要反复验证数据完整性,可以显著提高计算效率。

  各DataNode的缓存由NameNode统一管理,周期性地向后者发送cache report。NameNode周期性地查询自己的缓存指令集(Set of cache directives)来决定需要将哪些块缓存或解除缓存。

  每条缓存指令(Cache directive)可以定义一条需要被缓存路径,如果指定的是文件夹,则只有其中第一级的文件能被缓存。指令中还可以指定一些额外的参数,如复制系数和过期时间等。

  缓存池(Cache pool)是一个管理单元的概念,对于一组缓存指令集,对不用的用户进行指令的读,写,添加,删除等权限管理功能。同时还可以用于资源管理,如规定最大缓存量。还可以提供一些缓存数据的统计信息。另外,还可以为它的所有cache设置一个最大生存时间。

  目前只支持文件和文件夹级的缓存,将来可能会支持文件块及子块级的缓存。

转载于:https://www.cnblogs.com/lican/p/3681869.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值