hadoop学习之hadoop优缺点

hdfs是一个文件系统,通过目录树来定位资源,也是分布式的,通过很多个服务器来实现功能。
与window的ntfs文件系统同是文件系统,但是原理不同。

hdfs的设计适合一次写入,多次读出的场景,但是不支持文件的修改。
不适合网盘的应用(网盘需要下载和删除),适合用来数据的分析。
hdfs 优点:

  1. 高容错性:通过增加副本的形式,来提高容错性,而且数据自动保存多个副本。
    副本丢失以后,可以自动恢复。

  2. 适合大数据处理:数据规模达到pb级别。
    文件数量可以达到百万之多。

  3. 流式数据访问:一次写入,多次读取,不可更改,只可追加
    能保持数据的一致性 可构建在廉价服务器

  4. 可构建在廉价服务器

hadoop缺点:

  1. 不适合快速数据的存储
  2. 无法高效的对大量的小文件进行存储。效率非常低
    寻道的时间非常低
    访问时间与传输时间应该在一定的比例中,
    访问时间指的是寻找文件或者存放文件的时间,
    传输时间指的是客户端到hdfs系统传输文件的时间
  3. 一个文件只能一个线程写,只支持数据的追加

hadoop块大小为什么是128m?
在物理是分块存储(block)
Hadoop2.x以上都是128m,在集群运行的是128m,在本地运行的时候是64m

文件的寻址时间为传输时间的1%的时候,为最佳状态,寻址时间一般为10ms,
所以最佳的传输时间为10ms/1%为1000ms,也就是1s
目前的硬盘传输速率是100m/s,所以文件的大小在100m左右的时候,传输速率较高。

传输时间与文件的大小有关。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值