Filecoin存储之ceph系统的优化记录

Filecoin存储有的用的是昂贵的商业存储,有的用的是简单的nfs,我们公司用的是ceph文件系统。
各项技术的优劣在此不做评价,根据自己的实际情况来选择,不差钱又有技术能力那当然最好了。

本人在实践当中,发现ceph问题多多,算力低于1PiB的时候,问题一般暴露不出来,算力达到1.8PiB以后,时不时各种坑,执行ceph -s 出现各种头疼的HEALTH_WARN提示,让人防不胜防,不厌其烦,MDS也是各种问题,经常1 filesystem is degraded,然后就fil就掉算力,浏览器出现恐怖的红色的xxx faults。

出现问题要解决,可是错误提示都是冗长的英文,百度是搜不到的,google也很难匹配,偶尔有几个结果,还可能因为ceph版本不同,别人的解决方案不适合你,很让人纠结。filecoin生产环境下,ceph又不能让你随意测试,这就一个头两个大了。

见得多了,后来就慢慢摸出一点门道,ceph出现问题的根本原因是磁盘IO负载太重,而磁盘IO负载太重是因为ceph经常不定时执行deep_scrub,不停扫描磁盘。磁盘负载重,导致lotus 的window post不能及时完成,{"batch": 0, "elapsed": 187.471899623, "skip": 0, "err": null} ,就是这个elapsed这个参数太大,然后就掉算力了。

问题的原因,现象都知道了,现在就是要解决问题了,直接上代码。
措施1、在ceph的mon上执行
ceph tell osd.* in

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值