kernel: CPU0: Temperature/speed normal错误的解决办法

最新推荐文章于 2022-10-09 10:28:38 发布

最新推荐文章于 2022-10-09 10:28:38 发布 · 455 阅读

文章标签：

#运维 #操作系统

本文记录了一次Linux邮件服务器出现自动关机的情况及排查过程。通过查看系统日志发现与安全入侵无关，最终定位为CPU过热导致的问题，并计划进行硬件维护。

Posted bytiandion 九月 9, 2013 Views: 371

今天单位一台linux的mail server突然自己关机，其实上星期四已经关过一次了，当时我人不在机房，也没想仔细查看一下，只是以为可能电源线路有问题，造成的关机，因为这台机器一直很稳定，经常工作1年半载的没啥问题，连显示器都给我拿掉了。（可以ssh，要显示器干吗。。。)

吃完中饭回办公室，同事反映说这台机器关机了，于是ssh上去看了下日志，首先查看一下最近的重启情况。

[root@mail log]# last reboot
reboot   system boot  2.6.9-1.667smp   Mon Sep  9 16:07          (-1:-40)
reboot   system boot  2.6.9-1.667smp   Mon Sep  9 11:32          (02:54)
reboot   system boot  2.6.9-1.667smp   Fri Sep  6 14:23          (02:07)
reboot   system boot  2.6.9-1.667smp   Thu Sep  5 16:18          (21:06)
reboot   system boot  2.6.9-1.667smp   Thu Sep  5 15:57          (21:26)

确实是从上星期四开始有重启记录的，而且看记录，都和入侵丫的没鸟关系，基本排除被人shutdown的可能。随后查看message以及boot的日志信息，最后从密密麻麻的信息里找到了下面那一坨。

Sep  9 14:04:14 mail kernel: CPU1: Temperature above threshold
Sep  9 14:04:14 mail kernel: CPU1: Running in modulated clock mode
Sep  9 14:04:14 mail kernel: CPU0: Temperature/speed normal
Sep  9 14:04:51 mail kernel: CPU1: Temperature above threshold
Sep  9 14:04:51 mail kernel: CPU1: Running in modulated clock mode
Sep  9 14:04:51 mail kernel: CPU0: Temperature/speed normal
Sep  9 14:04:57 mail kernel: CPU1: Temperature above threshold
Sep  9 14:04:57 mail kernel: CPU1: Running in modulated clock mode
Sep  9 14:04:57 mail kernel: CPU0: Temperature/speed normal

我承认，这台机器够老了，估计风扇有严重积灰了或者彻底不工作了，导致的CPU温度过高，然后pia地华丽的关机了，星期三有空的时候拆机清理一下吧。（9.11日补充，今天拆机，果然CPU上的风扇了。）
PS:网上有误导的文章，修改了/etc/syslog.conf，注释掉相关错误信息的显示，这个简直就是掩耳盗铃么，丫的能解决问题吗？