- 博客(2)
- 问答 (2)
- 收藏
- 关注
原创 HDFS要点
<br /><br />引自 http://blog.csdn.net/adcxf/archive/2011/03/19/6261477.aspx<br /> <br />namenode存储的数据: <br />主控服务器主要有三类数据:文件系统的目录结构数据,各个文件的分块信息,数据块的位置信息(就数据块放置在哪些数据服务器上...)。在GFS和HDFS的架构中,只有文件的目录结构和分块信息才会被持久化到本地磁盘上,而数据块的位置信息则是通过动态汇总过来的,仅仅存活在内存数据结构中,机器挂了,就灰飞烟灭
2011-05-22 22:21:00 2220
原创 SequenceFile 解决hadoop小文件问题
SequenceFile Formats2010-10-27 18:50 OverviewSequenceFile is a flat file consisting of binary key/value pairs. It is extensively used in MapReduce as input/output formats. It is also worth noting that, internally, the temporary outputs of maps are stored u
2011-05-12 18:06:00 7271
空空如也
javaeye.com 目前存在的bug
2010-03-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人