作者介绍:
刘宝珍,架构师,目前就职于大型资产管理公司的科技子公司,拥有多年的大型私有云的规划和设计工作经验,熟悉软件的开发流程,目前醉心于研究基于DDD和敏捷的软件的开发模式,对分布式架构有深入的理解。文章来源:MySQL解决方案工程师。
成为【贤牛】工程师,按需运维,灵活用工,让运维工程师多赚一些零花钱,多一些企业级运维经验。
一、背景和大概的思路
2020年2月25日,微信的朋友圈大量转载微盟遭遇了系统重大故障,36小时内尚未恢复核心生产数据,从而想到本人在两周前处理的一个案例,开发人员误删除了生产数据,本人恢复的一个过程,同时给这个故障的处理过程做一个总结,也对学过的知识做一个梳理,希望对运维的同学们有一个警示作用。
2月13日23:00,接到微信通知,能否帮忙恢复数据。
系统环境信息如下:
** 操作系统:RHEL7.5**
** 工作流平台:开源 activity**
** 业务应用:调用 activity,生成该应用的流程数据。**
** 工作流使用的数据库:MYSQL 5.7 社区版,一主两备。**
23:05,开始介入数据丢失的故障。