一、背景介绍与优缺点
HDFS 适合于存储一次,读取多次的场合,存储入HDFS 后不可以对文件进行修改操作,只能够追加
二、HDFS组成
简单概括,NameNode 管映射,DataNode管存储
文件块(BLOCK)是集群中存储文件的单元,每个文件块的默认大小是128M。默认大小的含义是单个存储单位的存储“上限是”128。【dfs.blocksize】
当一个文件大小(1k)不足128M时,并不会占用128M,实际只占用1kb。
假设寻址(寻到block地址)的时间为10ms:
当磁盘传输速度为100M每秒,1秒钟一个BLOCK,设置blocksize为128刚好
当磁盘传输速度为200-300M每秒,1秒钟一个BLOCK,设置blocksize为256刚好
新浪面试题: