更多ceph相关文章详见知乎ceph专栏:聊聊ceph
Ceph中,每个pool可以设置size以及min_size。Size是该pool的副本数,min_size是指当集群出现故障时,PG至少还有min_size副本正常时,可以服务io。那么min_size是怎么控制io是否能服务的呢?
min_size控制io是否能服务主要是如下两步:
1. 根据min_size设置PG的状态
PG在peering状态结束后,也即在PG::RecoveryState::Active::react(const AllReplicasActivated &evt)函数中,会进行判断,如果该PG上acting状态的OSD数量大于等于min_size,设置该PG为PG_STATE_ACTIVE状态,否则设置为PG_STATE_PEERED状态。设置语句如下:
if (pg->acting.size() >= pg->pool.info.min_size) {
pg->state_set(PG_STATE_ACTIVE);
} else {
pg->state_set(PG_STATE_PEERED);
}
2. 根据PG状态判断是否能服务io
当有io服务落到这个PG时,这个时候ReplicatedPG::do_request函数会进行响应,然后在该函数里会判断PG的状态:若该PG的状态是active,则能服务io;否则若该PG的状态是PEERED,而不是active,则不会继续服务io,而是把该io丢到waiting_for_active队列后就返回了,等之后PG状态变成active了,再从该队列中拿出该io,进行重发。程序语句如下:
if (!is_active()) {
……..
waiting_for_active.push_back(op);
return;
}