记hy257.cn线上服务器全面崩盘事故

本文描述了作者在部署博客系统OneBlog时遇到的磁盘空间不足、CPU占用率过高和系统故障的问题,最终通过腾讯云工程师的介入得以解决,强调了部署前充分评估系统资源需求的重要性。
摘要由CSDN通过智能技术生成

记hy257.cn线上服务器全面崩盘事故
本文采用中国标准北京时间(UTC+08:00)

  • 2月11日
    • 21:30
      开始在线上环境部署已在测试服务器成功部署的博客系统OneBlog。
    • 21:43
      使用apt安装maven和jdk环境完成。
    • 22:05
      源码拉载成功,开始使用mvn打包。
    • 22:24
      打包成功,但过程中由于拉取了大量配置包,导致磁盘爆满到100%。
    • 23:15
      发现该磁盘问题,临时加部署了一块30G的云硬盘尝试挂载。
    • 23:35
      成功挂载到系统,尝试添加分区做永久挂载。
    • 23:41
      分区多次创建失败。由于系统盘100%,连mkdir操作都无法执行。
  • 2月12日
    • 00:31
      清除了一部分系统文件,尝试重启系统来释放空间。
    • 01:00
      执行reboot命令前,登录服务器提供商(腾讯云)控制台查看服务器状况,发现CPU异常飙升,占用率达到97%并持续不断。
    • 01:02
      执行了3次冷重启和1次强制断电后,均无法解决该CPU问题。
    • 01:13
      尝试使用VNC登录,但CPU直接爆100%,内存99%。VNC失败。
    • 01:26
      腾讯云工程师介入系统,开始排查问题。
    • 01:35
      腾讯云机房介入,实例进入救援模式。
      这是本服务数月来首次在腾讯云机器上进入救援模式。
    • 01:39
      腾讯云技术顾问开始排查问题。
    • 02:07
      硬盘成功腾空,但是CPU和内存居高不下。
    • 02:16
      开始设置nginx和docker的非开机自启并尝试重启。
    • 02:35
      确认是OneBlog博客系统导致的内存异常。已卸载该容器。
    • 03:16
      确认工作结束。
    • 06:27
      部分服务恢复正常。
    • 10:40
      主线服务恢复。

本次意外显示出了我工作的另一个问题,就是在部署前没有考虑好所需要的系统资源,最终导致了意外。

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值