现象说明:
在使用SQL Server 2005的过程中,最近经常有遇到一个现象:
用户进行一个分布式事务,有涉及到一台linked server 的一个表。
使用kill sessionid 来进行进程清除的时候,长时间该进程没有反应。
使用sp_who2,查询得到的状态为:killed /rollback
使用killed sessionid with stateonly
得到的结果为:rollback 100%
estinmated time 0
重新启动SQL Server,进行sp_who进行查询,发现该线程依然存在,并且现象依旧,在网络上进行查询,发现有很多同仁都有遇到该现象。而且该现象可以一直持续两周甚至更长时间。大家都只有重新启动服务器来解决问题。
最终解决方法:killed sessionid在进行终止SQL Server内部线程的同时,仅仅只是终止SQL中的内部事务,如果该事务有调用外部的命令或者事务,则外部事务需要手动停止,本例中由于是一个分布式事务,所以会调用MSDTC,所以在killled sessionid的同时,还需要把该事务在MSDTC Monitor中进行终止。这样才可以完全终止该数据库事务。
其他类似问题:
SQL Session调用了xp_cmdshell或者其他executable program等。在进行killed session的同时还需要终止该SQL线程所调用的外部进程。
有待解决的问题:出现该类问题需要手动处理,系统无法自动完成,所有有可能一个事务由于超时等原因导致系统自动回滚,而产生killed/rollback现象。导致了大批阻塞。严重影响性能。这个时候就需要手动处理,目前正在研究通过SCOM2007来监控SQL Server的该状况。有解决方法再与大家分享。