关于Hadoop的Append功能相信有很多人都会觉得非常有用, 自从0.18.3版本支持Append, Hadoop在此功能上付出了剧痛的代价, 后来版本中, Hadoop干脆加了fs.append.support选项来禁止Append功能的使用.
当时Append功能的bug主要有下面几个
大家可以通过[url]http://www.cloudera.com/blog/2009/07/file-appends-in-hdfs/[/url]了解append的过去
后来Hadoop对该功能投入较大精力, 俺也是一直关注着这个功能, 很遗憾的是到现在该功能还处测试, 并且hadoop-0.21这个版本Yahoo!准备skip掉.
附件中附上HDFS-Append的设计文档,由Contributor Hairong写的,目前还在讨论中.
当时Append功能的bug主要有下面几个
* HDFS-142 “Datanode should delete files under tmp when upgraded from 0.17″
* HADOOP-4692 “Namenode in infinite loop for replicating/deleting corrupted block”
* HDFS-145 “FSNameSystem#addStoredBlock does not handle inconsistent block length correctly”
* HDFS-168 “Block report processing should compare g[e]neration stamp”
大家可以通过[url]http://www.cloudera.com/blog/2009/07/file-appends-in-hdfs/[/url]了解append的过去
后来Hadoop对该功能投入较大精力, 俺也是一直关注着这个功能, 很遗憾的是到现在该功能还处测试, 并且hadoop-0.21这个版本Yahoo!准备skip掉.
附件中附上HDFS-Append的设计文档,由Contributor Hairong写的,目前还在讨论中.