数据库高回滚争用的问题

一个客户的数据库出现了严重的性能问题,根据awr的报告,系统性能问题与回滚的争用有关系。

 

 

正常情况下,客户数据库的AWRDB TIME信息为:

Elapsed: 119.92 (mins)
DB Time: 22.99 (mins)

而出现问题的时刻,DB TIME信息变成了:

Elapsed: 120.07 (mins)
DB Time: 37,447.52 (mins)

数据库服务器存在32CPU,可以看到,在采样期间,这32CPU几乎都是处于100%的工作状态。

Top 5 Timed Events

Event                           Waits  Time(s)  Avg Wait(ms)  % Total Call Time  Wait Class
enq: US – contention       1,995,867  943,404           473               42.0  Other
row cache lock                568,341  699,241         1,230               31.1  Concurrency
gc buffer busy                389,944  227,279           583               10.1  Cluster
enq: TX - index contention    393,340  171,647           436                7.6  Concurrency
buffer busy waits             186,159  107,135           576                4.8  Concurrency

观察TOP 5等待事件,发现大部分等待发生在enq: US – contentionrow cache lock上。根据这些信息判断,数据库可能碰到了bug7291739

根据metalink上这个bug的描述,这个bug会出现大量的enq: US – contention等待,而且还是出现latch: row cache objects的等待。而在dc_rollback_segments上会出现比较严重的latch锁。

检查正常时刻awr报告中dc_rollback_segments统计信息:

Cache                Get Requests Pct Miss Scan Reqs Pct Miss Mod Reqs Final Usage
dc_rollback_segments      185,406     0.00         0                 0       3,615

而对于问题时刻,dc_rollback_segments统计为:

Cache                Get Requests Pct Miss Scan Reqs Pct Miss Mod Reqs Final Usage
dc_rollback_segments    4,805,587     0.01         0             3,073       3,613

显然,出现问题时刻的dc_rollback_segments是正常时刻的50倍左右。

而另一方面,由于问题时刻之前,系统中出现了长运行的SQL语句,是的系统中回滚的争用大幅度的增长:

Undo Segment Stats
End Time     Num Undo Blocks Number of Transactions Max Qry Len (s) Max Tx Concy
05-May 18:08           7,608                 45,560            301         1,748
05-May 17:58           5,187                 24,909              0         1,364
05-May 17:48           1,229                  7,471              0           307
05-May 17:38           2,942                 16,753              0         1,002
05-May 17:28           1,119                  5,293              0           382
05-May 17:18           2,446                  6,925            898           502
05-May 17:08           2,137                  8,464            349           273
05-May 16:58           2,874                 27,562              0             6
05-May 16:48           2,625                 25,278              0             7
05-May 16:38           2,496                 23,711          1,006             8
05-May 16:28           2,194                 21,037            404             6
05-May 16:18           1,877                 17,981              0             5
05-May 16:08           1,883                 17,215              0             5

唯一的疑问是这个问题在10.2.0.4.410.2.0.511.2.0.1中被FIXED,而当前数据库补丁打到了10.2.0.4.7,因此当前问题就是这个bug还存在疑问。

而除了bug:7291739之外,OracleBug 8268775也都存在比较大的可能性。这个数据库确实是一个RAC环境,而且在bug发生期间,确实存在大量程序会话连接到实例的情况发生。

如果要是碰到了这个bug,那么在10.2中解决这个bug的可能性不大,至少要升级到11g才能解决这个问题。

 

 

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/4227/viewspace-695628/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/4227/viewspace-695628/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值