为什么不用mysql做数据仓库hdfs_为什么不建议将RAID用于Hadoop HDFS设置?

RAID用于两个目的.根据RAID配置,您可以获得:

>更好的性能:读取文件可以分布在多个磁盘上,也可以透明地使用不同的磁盘从同一文件系统中读取多个文件.

>容错:使用多个磁盘上的奇偶校验位复制或存储数据.如果磁盘发生故障,可以从其他副本恢复,或使用奇偶校验位重新计算.

HDFS具有类似的软件内置机制. HDFS将文件拆分为块(所谓的文件块),这些块在多个数据节点之间复制并存储在其本地文件系统中.通常,datanode有多个单独安装的磁盘(JBOD). datanode应在其所有磁盘/本地文件系统上分发其文件块.

这可以确保:

>容错:如果磁盘或节点发生故障,则可以在不同的数据节点和磁盘上使用其他副本.

>高顺序读/写性能:通过将文件拆分成多个块并将它们存储在不同的节点(和不同的磁盘)上,可以通过同时访问多个磁盘(在不同的节点上)并行读取文件.每个磁盘都可以使用其全带宽读取数据,并且其读取操作不会干扰其他磁盘.如果群集得到充分利用,所有磁盘将全速旋转,从而提供最大的顺序读取性能.

由于HDFS负责容错和“条带”读取,因此无需在HDFS下使用RAID.使用RAID只会更昂贵,提供更少的存储空间,而且速度也更慢(取决于具体的RAID配置).

由于namenode是HDFS中的单点故障,因此需要更可靠的硬件设置.因此,建议在名称节点上使用RAID.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值