ceph osd慢请求排查

文章探讨了如何使用Ceph的events功能来检测osd操作的耗时,特别是header_read事件耗时过长的问题。通过分析,作者指出可能的原因是数据从messenger读取延迟,涉及网络链路和CPU性能的影响。
摘要由CSDN通过智能技术生成

ceph 提供了较为完善的工具来trace osd的重要阶段耗时,称之为events,可以通过ceph daemon {admin-socket} dump_historic_slow_ops来查看,默认内存中只保存最近的osd_op_history_slow_op_size(默认20个),只要有一个请求的耗时超过osd_op_history_slow_op_threshold(默认10s),该op就会加入slow_op队列,举个例子,我们执行ceph daemon XX dump_historic_slow_ops后,发现有如下慢请求

可以发现整个请求的耗时主要在header_read event,该耗时显示header_read到all_read期间耗时18.1s,可以分析得出osd在从messenger中读取(0-4M)的数据花了18s,该请求是从10.124.107.8于12:03:35的cephfs client发出,发往osd的,进一步可以去看看src dst在这个时间点的网络链路、CPU情况

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值