自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 Linux OOM机制

Linux下面有个特性叫OOM killer(Out Of Memory killer),这个东西会在系统内存耗尽的情况下跳出来,选择性的干掉一些进程以求释放一些内存。典型的情况是:某天机器突然登不上了能ping通,但是ssh死活连不了。原因是sshd进程被OOM killer干掉了。重启机器后查看系统日志会发现Out of Memory:...

2019-03-15 14:26:49 295

原创 Linux OOM机制&线上osd异常kill

一 引言某日早上收到邮件告警信息,上报pg stale以及recovery信息,于是登录系统运维。二 排查&解决登录系统后发现系统已恢复正常,按照正常来讲并无影响,但系统既已出现recovery信息意味着一定有osd down发生。于是排查osd日志,发现某osd上报心跳问题。登录到所在osd 查看osd日志,并无对应错误,但osd进程莫名其妙重启了。查阅进程验证...

2019-03-15 14:17:07 434

原创 ceph集群换盘

一引言某地项目运行两年后磁盘批量报错,利用smartctl检测发现出现大量扇区错误,但并未达到彻底无法读写程度,统计下来发现数量接近40块,考虑批次换盘。坏盘期间为了保证不影响业务,需拟定一个较好的方案。二 方案在查阅一堆资料后,发现无论采用哪种方案换盘都会出现大量的数据迁移。上图引用至张鹏博客由于线上项目数据量巨大,恢复周期长,采取这种方式换盘并不能完全达到我们的需求。因...

2019-03-13 10:39:00 760

原创 集群ceph df中pool 与 global不一致问题

一 引言某地存储项目中由于每天都需要统计存储使用量及业务量,在某一日统计存储使用量时发现global中容量与各池的可用容量不一致,由此产生疑问。二 Global & Pool统计分析代码,发现ceph df在monitor中的处理逻辑是monito.cc handle_command:这部分代码里主要分为两部分:一部分是对于Global输出的统计,另外一部分是对于各池的统计。{...

2019-03-13 10:02:35 1747 1

原创 FileStore omap的实现

目录一 引言二 omap实现三 omap寻址四 omap属性设置五 header ->seq的由来一 引言ceph分布式存储中在本地存储方面采用插件模式,支持filestore、bluestore、memstore等存储引擎。FileStore承载着数据的存储,除了要将数据写入本地文件系统外,还需要存储部分数据的属性信息,少量的元数据信息存储在文件系统的xattr...

2019-03-12 13:11:26 574

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除