2台sun890小机,solaris10操作系统,oracle 10.2.0.1 RAC+ASM
连续出现小机系统自动重启的问题,而且是2台小机同时重启
运行了几年的系统了,一直没出现过这种问题。忽然想起来1周前改过NTP服务。原来是小机A做时间服务器,小机B与小机A同步,由于小机时钟不准确(每个月要比北京时间提前3-4分钟),把2台小机的时间服务器都指向一台windows时间服务器。
没2天小机时间要比windows时间服务器提前0.3-0.5秒,这样,NTP同步的时候,会把系统时钟往后调整0.3-0.5秒,导致2台小机系统自动重启。
血一样的教训,RAC的时间同步真成问题,往前调整时间问题不大,往回调整零点几秒都会造成系统重启。
网上查了几天,QQ群也问了很多人,都没见到NTP会导致RAC迫使操作系统重启的文章。
BUG害死人啊。。。
# Interim Patch for Base Bug: 5015469
#-------------------------------------------------------------------------
#
# DATE: Mar 28 2006
# -----------------
# Platform Patch for : Solaris Operating System (SPARC 64-bit)
# Product Version # : 10.2.0.1
# Product Patched : CRS
#
# Bugs Fixed by this patch:
# -------------------------
# 5015469:OPROCD REBOOTS NODE WHEN TIME IS SET BACK BY XNTPD
经过实验,IBM p570小机,AIX 5310系统,oracle 10.2.0.1 RAC+ASM,时间往回调整2分钟一样导致操作系统重启,看来这个BUG不只在solaris上才有。
RAC调整时间一定要谨慎再谨慎!!!