关于什么是RAID 0,请参照另外一篇文章http://blog.csdn.net/post_yuan/article/details/53516127,这里主要总结一下为什么Hadoop不用RAID 0的原因。关于这个问题,如果想了解详细也可参考文章: http://zh.hortonworks.com/blog/why-not-raid-0-its-about-time-and-snowflakes/
1. 速度
(1)Hadoop采用的是JBOD(Just a Bunch Of Disks)配置,JBOD在所有磁盘之间循环调度HDFS块。据雅虎集群评测报告表明,JBOD比RAID 0要快30%
(2)RAID 0的读写操作受限于磁盘阵列中最慢盘片的速度,而JBOD的磁盘操作均独立,因而平均读写速度高于最慢盘片的读写速度。
2. 可用性
(1)RAID 0无冗余机制,若RAID中的某一个盘片故障则整个磁盘阵列不可用,而JBOD配置中某一磁盘出现故障,HDFS可以忽略该磁盘,继续工作。