1、文件线性按字节切割成块(block),具有offset、id
2、文件和文件block大小可以不相等
3、一个文件除了最后一个block,其它block大小一致
4、block大小可以根据硬件I/O特性调整,Hadoop 1.x版本时,block块大小默认为64MB,在Hadoop 2.x版本时,block块大小默认为128MB
5、block被分散存放在集群的节点,具有location
6、block具有副本(replication),没有主从概念,副本不能同时出现在同一节点,副本是满足可靠性和性能的关键
7、文件上传可指定block的大小和副本数,上传后只能修改副本数
8、一次写入多次读取,不能修改,但是支持数据追加