一个笼子24块硬盘,每块硬盘600G
买了4个笼子
磁盘阵列控制器需要磁盘,并且要做raid5,做了raid5凑个双数,所以一共用了4块硬盘(感觉有点浪费)
第一笼子剩下24-4 = 20块硬盘,需要额外一块热备20-1=19。
剩下19块分为两个组9、10,由于校验位、可用容量为(9-1)*0.6T 和 (10-1)*0.6T,即4.8T、5.4T
0.6*(9-1 + 10-1 )/ 0.6*24 = 17 / 24 =70.8%
开始乙方提供的默认推荐方案浪费更多,每组用一块热备、每个笼子再来一块热备,被否决了。
第一个笼子可以坏几块盘的问题:
先搞清楚最简单的情况,3块500G的硬盘做了raid5,可用容量是1000G,最多可以坏1块盘,坏了就要把坏盘换掉,买新盘换上。这样就复原了,如果买盘换上之前再出故障,数据就全没了。
有热备盘的情况,4块500G硬盘,3块做raid5,一块热备。可用坏2块盘,坏了一块之后,热备顶上,顶上之后再坏一块没事,raid5本来就是N块当N-1块盘用。
每组中可以坏一块,比如1到10号盘为第一组raid5 , 11到19号为第二组raid5,每组中可以坏一块盘,坏了之后热备盘可以直接顶上,热备盘直接顶上,应该比没有热备盘,坏了盘往上换的代价(对I/O的影响)要小。1到10可以坏1块,坏了之后热备盘顶上,这个时候(手中没有备用盘去补热备盘的时候)还可以再坏一块。这个热备盘是第一组raid和第二组raid公用的。最多坏2到3块盘,坏三块盘的情况是:两组raid,一组坏1块,另一组坏2块(并且这两块不同同时坏,坏的时间太近,必须等热备盘重构好)
剩下的三个笼子中24块盘,24-1=23,分成两组raid5,11+12,可用容量是(11-1)*600G + (12-1)*600G
供货商称,raid5一般推荐不超过15块盘,超过15块故障率较高,这个故障率是概率算出来的理论值,不是因为技术问题导致故障率高。概率算出来超过15不划算。