大数据相关知识点总结汇总
(思维导图在页面最后)
分布式存储HDFS
1. Hadoop的历史
作者dogcutting
Doug Cutting是Lucene、Nutch 、Hadoop等项目的发起人
1.1.Hadoop的三驾马车
-
GFS
-
MapReduce
-
BigTable
1.2.hadoop生态圈
-
hdfs
-
mapreduce
-
yarn
-
common
2.HDFS的存储原理
2.1 各个角色的作用
2.1.1 NameNode
1. 接受客户端的读写请求
2. 管理元数据
-
上传的文件的权限
-
上传文件的属主以及属组
-
上传文件的时间
-
上传文件的block数以及ID号
-
每一个Block的位置信息是由DN在集群启动之时汇报的 不会持久化
-
各个DN位置信息