Hadoop cdh4.2.0配置 ShortCircuitRead

Hadoop在读数据时提供了一种优化:如果读的block文件在本地时,hdfs的client会直接读本地data.dir内的block文件,而不是从datanode的网络端口读取。这个优化在mapreduce时会对性能有很大的提升,因为一般来说mapper都会和读取数据在一台server上。

ShortCircuitRead功能在chd4.1.0上有bug,除了hdfs用户其他用户比如hbase,yarn都不能采用ShortCircuitRead。在cdh4.2.0上修复了此bug,因此我们能够在此版本上enable这个功能。


步骤:

1.在hadoop的配置文件hdfs-site.xml中添加以下配置项:

<property>
    <name>dfs.client.read.shortcircuit</name>
    <value>true</value>
</property>
2.如果非hbase、mapreduce程序需要在启动参数中加入native配置,hbase和mapreduce因为在启动时会加载hadoop的native库所以不需要此配置:

-Djava.library.path=/usr/lib/hadoop/lib/native"

在配置好后开启debuglog读文件,如果正好读取的block在本地就可以看到对应的log了:

The short-circuit local reads feature is enabled.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值