oracle-故障处理
文章平均质量分 80
YiYuF点滴记录
深入数据库,结合业务优化数据库
展开
-
一次CTS引发的网络故障
接到兄弟部门通知,A机房(库a)到B机房(库b)之间的数据库服务器之间的网络带宽异常突增,影响公司对外业务的整体带宽。 一接到通知,作为数据库管理对所涉及的IP还是比较敏感。第一反应就是可能当时主库产生的归档特别多,把归档通过RFS进程到机房B的备库所消耗的带宽。表面上觉得很正常,这是oracle DG所需嘛! 深入分析才找到了产生大量归档的根本原因: 一、先统计下异常时间短内到底产生了多原创 2014-03-14 09:59:59 · 638 阅读 · 0 评论 -
一次goldengate故障引发的操作系统hang起,HA自动切换
现场: 跑着数据库的主机A报警应用连接不上数据库,我们无法ssh到主机。第一反应是通过telnet到远程控制口,发现数据库资源和硬件资源在被切换到HA架构的主机B(备机,通常性能比主机A的差,抗不住应用)。此时HA已经把数据库切到了备机上,勉强抗着应用。 分析: 一、查看故障机(主机A)的操作系统日志和oracle alert日志有大量的如下报错: OS: Mar 17 14原创 2014-03-18 17:03:58 · 610 阅读 · 0 评论