- 博客(2)
- 收藏
- 关注
原创 trevni总结。设计,优点,代码实现。
学习过程中碰到了trevni,trevni的资料不多,学习起来比较吃力。我总结了自己学习的一些知识,肯定不完善,先写下来,以后再补充。普通的数据集一般都设计成很多行和很多列,每条记录就是一行,每个字段作为一列。写入记录时,就是把一行又一行写入文件,就像hadoop的sequence file。在一些情况下,列存储的性能比行存储会高很多。trevni就是一种列存储格式。数据集被分成多个row g
2013-05-04 14:43:52 470
原创 hadoop block源代码分析DataNode部分(一)
hadoop作为开源软件,之前我一直看它的原理和结构,已经了解了不少。但是要想深入了解hadoop的思想和设计,我觉得还是必须要研究源代码。目前我正在看Hadoop源代码分析,是别人总结出的文档。接下来我会写一些自己的心得。第一部分先写DataNode。一个HDFS系统包括NameNode和DataNode。NameNode维护名字空间,DataNode存储数据块。DataNode
2013-04-20 15:32:37 633
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人