hadoop
hadoop common :提供大数据支持的基础工具包
hdfs:分布式文件系统
yarn:提供作业调度和集群资源管理
mapreduce
分布式文件系统HDFS
1、文件线性切割成块block
以字节byte为单位进行切割。对UTF-8编码的汉字占三个字节,如何保证在同一个块中?
块分散在服务器集群中
偏移量 offset 标识此块存储文件的哪一部分
单一文件block大小一致,不同文件可不一致
2、可以append追加新的块
只支持一次写入,不能修改数据,可多次读取
不可以修改