HDFS概述
1、分布式
2、commodity hardware 通用硬件上面
3、fault-tolerant 容错性
4、high throughput 高吞吐量
5、large data sets 大数级
HDFS是一个分布式的文件系统
文件系统:Linux、Windows、Mac.....
普通文件系统:单机
分布式文件系统 :布式文件系统可以横跨N个机器
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
1、NameNode(master) and DataNodes(slave)
2、master/slave的架构
3、NN : he file system namespace
4、DN 负责数据的存储
5、exposes a file system namespace and allows user data to be stored in files
6、blocks are stored in a set of DataNodes