第一次遭遇云服务器完全崩溃:CPU 突然 100%、控制台无法重启、控制台无法强制关机。到目前为止,腾讯云的工程师和我本人都没有找到具体原因。
本文所示图片使用的是 github 仓库图片,网速过慢的朋友请移步原文地址或者来我的小站godbmw.com
1. 案件陈述
- 案发地点:腾讯学生云 ubuntu 16.04,宽带 1M
- 案发时间:2018-10-09 13:40
- 案件陈述:
- 2018-10-09 12:37 左右,CPU 使用率突增到 100%,内网出入宽带、流量包、内存使用量均无异常。
- 2018-10-09 13:28 正式死机,控制台无法强制重启(清除缓存、更换浏览器依然无法重启)、无法强制关机。
- 开始提交工单,周折很久,讨论无果。遂没有消息。
- 2018-10-09 14:00 重回控制台,再次强制重启成功!
- 重新上线了自己的项目和公司的一些脚本,庆幸没造成损失。
- 检查日志,和腾讯云工单的工程师讨论。双方确认日志没有问题,无法排查出错误。
2. 灾难现场
首先是,个人网站无法进