昨天下午兄弟部门缓冲记账发布,程序发布到生产上报了大量"ORA-00060: 等待资源时检测到死锁"异常
被同事叫去帮助排查问题
初见异常,判断是发生了AB、BA资源互相等待导致的死锁
跟开发开发负责人沟通坚持说新写的事务中只有一个insert一个update,特意编写了这种场景的demo,发现这种情况不可能导致死锁
遂让开发负责人修改<prop key="hibernate.show_sql">false</prop>为true
做对应操作,根据打印的sql日志分析事务中的逻辑,发现事务中有一个循环记账的update,逻辑为遍历容器更新容器中的账户余额
新逻辑循环遍历map.values()元素
与原逻辑中直接遍历HashMap顺序可能发生颠倒
从而导致AB.BA行级锁死锁
问题定位,正在压测环境复现,计划在遍历之前按账户id排序后再遍历更新账户
解决方案,将HashMap改为TreeMap