ceph的数据存储之路(6) -----pg的创建

PG 的创建过程

PG的创建是由monitor节点发起,形成请求message发送给osd,在osd上创建pg

 

一、monitor节点处理

1. monitor中由PGmonitor发现是否创建了poolpool中是否存在pg需要进行创建。首先来看函数PGMonitor::register_new_pgs()

192756_06kr_2460844.png

1059:循环遍历当前这个pool中的所有pg

1061:根据当前这个poolpg的序号和poolid,形成pg_id。(pg_id 就是用来统计哪个pool中的第几个pg而已,使用mseed作为pg序号,mpool作为pool序号)。

1062pg_map中统计了所有的pg,如果发现当前的pg不再pg_map中,说明这个pg是需要被创建的。

1068:使用register_pg函数开始处理申请这个pg

 

2.register_pg()函数开始对pg的申请进行处理,这时已经有了pg_id pool的信息。

192756_winP_2460844.png

1007:将刚刚创建的pg_id统计到pending_inc.pg_stat_updates结构中。

1008:设置这个pg的状态为PG_STATE_CREATING

接下来会将这个pending_inc 进行打包,然后推行propose_pending,开始提议议题,等待完成最后推行。

 

3.决策推行函数update_from_paxos,在这里会根据仲裁决定,然后处理结果,上面说道已经推行了创建pg

192757_diuf_2460844.png

 

0232:重新解码inc 的决议。

0242:将这个决议交给pg_map进行处理,调用PGMap::apply_incremental()

0295: map_pg_creates将需要创建的pg进行映射到 对应的pg上面。

0296send_pg_creates 开始将已经准备下发给osdmessage

 

4.先来看看这个PGMap::apply_incremental(),在函数内会从新解析pg_stat_updates中的成员,获取每一个成员的pg_idpg_state。然后将这两个参数交给stat_pg_add()

192757_gIIS_2460844.png

0482:如果当前的pg_state 状态是PG_STATE_CREATING,代表他需要被创建。

0484:将这个pg_id添加creating_pgs的队列中,等待被处理。

 

5.当需要被创建的pg_id已经添加到creating_pgs中之后,就会继续交给map_pg_creates()处理了,下面看看这个函数。

 

192758_RVcB_2460844.png

1143:开始尝试遍历creating_pgs的队列。

1146:重新解析pg_id

1149:判断这个pg是否已经存在了。当然第一次创建pg这里是不会出现的。

1165:这里根据pg_id等信息可以找到osd的集合,并且知道那些是主osd

1191:在pg_map中同样存在一个队列creating_pgs_by_osd,这个队列中保存着每个osd需要创建的pg

 

6.这样这个创建pg的请求就转化成了creating_pgs_by_osd队列的处理了,下面看下处理这个队列的函数send_pg_creates().在这里按着osd进行处理继续分发到send_pg_creates(osd,con)中进行处理。

192759_KO7x_2460844.png

1239:这时创建一个用于传递创建pg的消息 MOSDPGCreate

1240:开始整理这个osd上所有需要创建的pg_id.

1242:将这个需要创建的pg都封装到mmkpg中。

接下来就是通过monitormessager模块将消息发送给了osd。接下来看看osd的处理。消息封装解封的过程就不描述了。

 

二、osd的创建pg请求处理

osd这时会收到一个消息 根据消息命令字MSG_OSD_PG_CREATE,发现这是一个创建pg的消息,然后交给handle_pg_create进行处理。

192759_t7CO_2460844.png

7225handle_pg_create开始处理创建pg的请求。

7227:从消息请求op中恢复出MOSDPGCreate message

192759_YHBW_2460844.png

7269:在消息中恢复了所有的pg请求。

7280:解析出pg的编号pg_id到变量on上。

192759_OXf1_2460844.png

7320:根据pg_idon开始创建出spg_tpgidspg_t结构中主要记录两个信息,一个是pg_id的序号,另外一个就是primaryosd序号。

192800_hvN1_2460844.png

 7362:将history信息根据pgid添加到creating_pgs结构中。

7363:将parent信息根据pgid添加到creating_pgs结构中。

7364:将acting信息根据pgid添加到creating_pgs结构中。

7365:开始获取当前pg的所有osd信息 根据pgid添加到creating_pgs结构中。

7400:开始准备创建一个pg了,调用函数_create_lock_pg().该函数中继续调用_open_lock_pg()_make_pg()来创建PG

192800_oP0m_2460844.png

2548:判断这个pool的类型是replicated 还是erasure类型的。

2551:这里开始创建PG,这个PG的具体实现方式就是ReplicatedPG

 

然后在回到函数handle_pg_create中继续进行pg->handle_create(&rctx);

pg->handle_create 开始一个pg的状态处理。后面的章节会描述pg状态的变化过程。pg的状态变化过程叫做peering

 

转载于:https://my.oschina.net/u/2460844/blog/535007

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值