DFS目录
- dfs目录在NameNode被格式化的时候产生
- dfs目录的子目录:name、data、namesecondary
- in_use.lock标记当前节点已经在使用
- HDFS第一次启动的时候,会默认在1min的时候进行一次合并,之后就按照更新条件啦进行合并
- edits文件的开始和结束都会算作一次事务
- 上传文件:
- OP_ADD:在指定目录下创建一个同名文件._COPYING_,此时这个文件允许写入
- OP_ALLOCATE_BLOCK_ID:分配BlockID
- OP_SET_GENSTAMP_V2:给时间戳分配一个编号
- OP_ADD_BLOCK:将数据传输到HDFS上
- OP_CLOSE:关流,关闭文件,此时文件不允许写入
- OP_RENAME_OLD:重命名
- edits文件的转化命令:hdfs oev -i edits_XXX -o xxx.xml
- fsimage文件的转化命令:hdfs oiv -i fsimage_0000000000000000000 -o f.xml -p XML
- VERSION文件:
- clusterID:集群编号。在NameNode被格式化的时候,自动计算一个clusterID,并且会在启动HDFS之后,NameNode会将clusterID分发给每一个DataNode;NameNode每格式化一次,clusterID都会重新计算
- storageType:节点类型
- blockpoolID:块池ID。主用于联邦HDFS中