hadoop001

Hadoop

**HDFS要点

  • 文件的线性分割------Block; 偏移量(文件以二进制存储,计算机最小单位byte,hdfs解决了中文被拆分问题)
  • Block需要均匀的分散存储在集群节点之中,副本的数量不要超过集群节点的数量(相同的数据在同一节点存储多份没有意义)。
  • 单个Block的大小是一致的(hadoop2.x以上一个Block的大小是128MB),文件和文件的大小可以不一致
  • Block的副本数是可以设置的,默认是3个。根据数据的重要性和访问量的大小,增加Block的数量,会增加计算向数据移动的成功率,缺点:增加Block的数量会增加存储空间的大小,需要更多的磁盘存储。
  • 已上传的文件Block,可以修改数量,大小不变
  • 文件只支持一次写入,多次读取,同一时刻只能有一个写入者。写入会引起“蝴蝶效应”,牵一发而动全身,不容许!!!
  • 文件支持append追加数据**
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值