oracle 进程已经Kill,但仍然存在的孤立会话(orphan session)的彻底清理

1.问题描叙

不久前看到了一个问题:
有许多会话正在等待对象上的锁,并且有一个会话阻止了其他会话。
为了解决这个问题,使用命令“alter system Kill session…”kill了阻塞进程,并且会话被标记为“killed"。一段时间后,会话仍然显示为killed状态,server列为PSEUDO, 但会话仍然存在,并且未真正从数据库中释放。

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

现在,为了终止会话,尝试在 v$process 视图中获取相应的进程,但没有将 v s e s s i o n 的 p a d d r 列与 v session 的 paddr 列与 v sessionpaddr列与vprocess 的 addr 列相匹配的条目。

SQL> select spid from v$process where addr in (select paddr from v$session where status='KILLED');
no rows selected

也没有匹配的transaction

SQL> select * from v$transaction where  addr in (select saddr from v$session where status='KILLED');
no rows selected

v$process 中没有该会话的匹配行。因此无法使用命令kill -9 终止该进程,这就是传说中的orphan session.

2.Solution

2.1 尝试唤醒pmon

由于某种原因,pmon 无法清理该会话,并且它仍然作为孤立会话存在于数据库中

SQL> SELECT pid FROM v$process
WHERE addr = 
(
    SELECT paddr FROM v$bgprocess
    WHERE name = 'PMON'
); 
ORADEBUG WAKEUP 2

会话仍然存在

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

2.2 尝试alter system disconnect方式,会话依然存在


SQL> select 'alter system disconnect session ''' || SID || ',' || SERIAL# || ''' immediate;' from v$session where STATUS not in ('ACTIVE','INACTIVE');

'ALTERSYSTEMDISCONNECTSESSION'''||SID||','||SERIAL#||'''IMMEDIATE;'
--------------------------------------------------------------------------------
alter system disconnect session '133,53570' immediate;
alter system disconnect session '573,2831' immediate;
SQL> alter system disconnect session '133,53570' immediate;
System altered.
SQL> alter system disconnect session '573,2831' immediate;
System altered.

会话仍然存在:

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

2.3 从 oracle 文档 ID 387077.1 获取帮助。

如果并且使用的是 11g,那么可以使用此 MOS 说明来尝试解决。
基本上,当会话被终止时会发生什么,然后创建一个新的进程 ID,并且 v$process 中与先前存在的会话的 addr 行相匹配的 addr 行将不再存在。相反,将出现一个新行。 识别进程并修复此问题,在 11g 中添加了几个附加列到 V$SESSION 中:
V$SESSION:
1.CREATOR_ADDR - 创建进程的状态对象地址
2.CREATOR_SERIAL# - 创建进程的序列号
其中,CREATOR_ADDR 是可以与 V$PROCESS 中的 ADDR 列连接的列,以唯一标识与前一个会话对应的被杀死的进程。
使用这些列,我们可以识别被终止会话的进程 ID。为了识别新的进程 ID,可以使用以下查询。

select * from v$process where addr in (select Creator_addr from v$session where status='killed');

一旦从上面的查询中获得了进程ID,剩下的任务就很简单了。现在我们只需要从操作系统中杀死相应的进程ID。
-> kill -9
现在只需要耐心等待,pmon 进程需要一些时间才能完成清理工作。

2.4 oracle 10g中的处理

很遗憾,我使用的版本是oracle 10g,无法按照2.3中MOS文档步骤来处理此问题,但是从上述的思路中,可以知道会话会创建新的进程,因此我们受用如下sql找出新增的进程

SQL>SELECT addr,pid,spid,username,serial#,terminal,program FROM V$PROCESS WHERE 
PROGRAM NOT IN ('PSEUDO')
AND ADDR NOT IN (SELECT PADDR FROM V$BGPROCESS)
AND ADDR NOT IN (SELECT PADDR FROM V$SESSION)
AND ADDR NOT IN (SELECT PADDR FROM V$SHARED_SERVER)
AND ADDR NOT IN (SELECT PADDR FROM V$DISPATCHER)
ADDR                    PID SPID         USERNAME                SERIAL# TERMINAL             PROGRAM
---------------- ---------- ------------ -------------------- ---------- -------------------- --------------------
0000000B9F3591D0        289 17892        oracle                       21 UNKNOWN              oracle@hrisdb_prod
0000000B9930D0E8        291 17894        oracle                      132 UNKNOWN              oracle@hrisdb_prod

知道spid后,就好处理了

[oracle@hrisdb_prod ~]$ kill -9 17892
[oracle@hrisdb_prod ~]$ kill -9 17894

再次查询,已经消失

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
no rows selected
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Linux 环境下,僵尸进程和孤儿进程是两种不同的进程状态。 僵尸进程已经终止但其父进程没有调用 `wait` 函数获取它的终止状态,导致它的进程描述符仍然存在于系统中。僵尸进程不占用系统资源,但是如果过多地产生僵尸进程,可能会对系统造成影响。 孤儿进程是指其父进程已经终止,但其本身并未终止的进程。这样的进程将被系统的 init 进程进程号为 1)收养,并由 init 进程继续等待它们的终止状态。 因此,僵尸进程是由父进程造成的,孤儿进程则是由父进程终止造成的。 ### 回答2: 在Linux环境下,僵尸进程和孤儿进程是两种不同的进程状态。 首先,孤儿进程是指其父进程在其结束之前就已经终止的进程。当一个父进程终止时,内核会将孤儿进程的新父进程改为init进程进程号为1的特殊进程),即使孤儿进程的原父进程退出,孤儿进程仍然可以继续运行。孤儿进程的特点是没有父进程,但是仍然有自己的进程ID,系统会负责清理孤儿进程的相关资源。 而僵尸进程是指一个进程已经终止,但是其父进程尚未对其进行处理的进程。当一个进程终止时,其实际完成的资源清理工作并未立即进行,而是进入了僵尸状态。在这个状态下,僵尸进程进程ID仍然存在,但是它不再消耗系统资源,仅占用一定的进程表项。此时,其父进程可以通过系统调用wait、waitpid或者其他相应的方式来回收僵尸进程释放相关的资源。如果父进程长时间不进行处理,僵尸进程可能会大量存在,浪费系统资源。 总结而言,孤儿进程是指其父进程已经结束的进程,它的特点是改变了父进程,但仍然可以继续运行;而僵尸进程是指进程已经终止,但其父进程尚未对其进行处理,它的特点是无法消耗系统资源,但会占用进程表项。 ### 回答3: 在Linux环境下,僵尸进程和孤儿进程是两种不同的进程状态。 1. 僵尸进程(Zombie Process)是指一个子进程已经执行结束,但是父进程还未对该子进程进行资源回收的状态。在子进程结束后,父进程可以通过调用wait()或waitpid()系统调用接收子进程的返回值,并对其进行回收,释放进程占用的资源。如果父进程没有对子进程进行回收处理,子进程进程描述符会保存在内核的进程表中,并标记为僵尸进程。僵尸进程并不会占用系统资源,但如果存在大量僵尸进程,可能会导致进程表溢出,影响系统的正常运行。 2. 孤儿进程Orphan Process)是指一个子进程的父进程已经先于子进程结束时,子进程成为孤儿进程。孤儿进程将被init进程进程ID为1)成为其新的父进程。在Linux系统中,init进程负责对孤儿进程进行资源回收。当子进程的父进程意外终止或者提前结束时,子进程将变为孤儿进程,然后由init进程接管并进行回收资源。孤儿进程不会影响正常运行,但是可能会占用一些系统资源,因此及时回收孤儿进程是很重要的。 综上所述,僵尸进程和孤儿进程的区别主要在于状态和处理方式。僵尸进程是指子进程已经结束但父进程未回收其资源,而孤儿进程是指子进程的父进程已经结束导致子进程成为孤儿,并被init进程接管回收资源。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值