oracle的DCD,死联接检测(DCD)的探讨与研究

dcd 起初是专为 客户机没有从会话中断开联接的情况下断电的环境设计的.

dcd由服务端开始建立联接. 这时候sql*net 从参数文件中读取变量, 设置一个定时器定时产生信号. 这个时间间隔是sqlnet.ora文件中的sqlnet.expire_time提供的.

当定时器设定的时间到了之后, 服务器上的sql*net 发送一个探测包到客户端.(如果是数据库联接, 目的端的服务器发送探测包到另一端). 探测包是由空的sql*net包组成, 不体现sql*net层任何数据, 但会在下一层的网络协议中产生数据流量.

如果客户端的联接仍然是活动的, 探测包被丢弃. 计时装置复位. 如果客户端异常断掉. 服务器将收到由发送探测包的调用发出的错误. sql*net 将会通知操作系统释放联接占用的资源.

在unix服务器上 sqlnet.ora 文件必须存在$tns_admin 或者 $oracle_home/network/admin目录下.   而不是/etc 或者 /var/opt/oracle

同时也应该注意, sql*net 2.1.x中 一个活动的孤儿进程(例如, 单独的查询进程) 在查询完成之前不会被杀掉. sql*net 2.2中孤儿进程占用的资源将会被无条件释放.

这只是服务器的特性,  客户端将会支持任何sql*net v2 的发行版

协议栈的功能

虽然 死联接检测是在sql*net层的, 但要成功执行在很大程度上要依靠下层协议栈. 例如, 如果在sqlnet.ora文件中 设置sqlnet.expire_time=1, 但是一个孤儿进程很有可能在间隔到了之后被清除掉.

tcp/ip协议是一个面向联接的协议, 同样的, 这个协议在超时时执行重传数据包的操作, 确保数据的安全和数据包的顺序. 如果对探测包没有及时回应, tcp/ip栈将在一段时间内重传这个包. 当tcp/ip放弃重传之后, sql*net 将会收到 探测失败的通知.

tcp/ip超时的时间取决于 tcp/ip栈,  超时很多分钟是很常见的, 这个涉及到很多客户, 许多协议层的重传会造成孤儿进程被杀掉之前要等很长时间.

最简单的办法检测协议栈有这个延迟需要测试不同的dcd间隔.

测试协议栈

设置参数sqlnet.expire_time = 1 min, 注意清除孤儿进程需要的时间. 然后设置为 5min,

再次观察这个时间. 如果服务器没有释放资源是由于tcp/ip超时造成的, 清除影子的时间需要增加到4min.

如果tcp/ip超时重传是造成问题的所在, 操作系统的内核参数应该调整一下, 在unix平台下, /usr/include/netinet/tcp_timer.h 中包含着配置参数.

减小重传间隔可能会影响系统的其它部分, 因为实际上减小了联接处理数据的窗口, 可能会在系统重负荷的情况下丢失联接, 远程慢的联接会受到这个更改的影响。

系统参数会影响超时重传的有 tcp_ttl, tcptv_persmin, tcptv_max, 和 tcp_lingertime等。

********************

为了防止对系统其他进程产生影响, 在调整系统参数时最好向相关的厂家咨询

*******************

监控 死联接检测

检测dcd是否打开和运行正常最好的方法就是 产生一个服务跟踪文件, 查找 dcd探测包.

要产生一个服务跟踪文件, 在sqlnet.ora文件中设置trace_level_server=16, tace_directory_server=;, 跟踪文件svr_;.trc文件会在那个目录下产生.

dcd 是否打开?

在跟踪文件中查找:

osntns: enabling dead connection detection (1 min)

时间间隔应该和sqlnet.expire_time的一样.

dcd是否正常工作?

在跟踪文件中应该有类似:nstimexp: entrynstimexp: timer expired at 05-oct-95 12:15:05nsdo: entrynsdo: cid=0, opcode=67, *bl=0, *what=1, uflgs=0nsdo: nsctx: state=8, flg=0x621c, mvd=0nsdo: gtn=93, gtc=93, ptn=10, ptc=2048nsdoacts: entrynsdofls: entrynsdofls: data flags: 0x0nsdofls: sending nsptda packetnspsend: entrynspsend: plen=10, type=6nttwr: entrynttwr: socket 4 had bytes written=10nttwr: exitnspsend: 10 bytes to transportnspsend:packet dumpnspsend:00 0a 00 00 06 00 00 00 |........|nspsend:00 00 00 00 00 00 00 00 |........|nspsend: normal exitnsdofls: exit (0)nsdoacts: flushing transportnttctl: entrynsdoacts: normal exitnsdo: normal exitnstimexp: normal exit其中nspsend:00 0a 00 00 06 00 00 00 |........|nspsend:00 00 00 00 00 00 00 00 |........|

代表探测包, 是由10个字节组成, 当协议头和尾被加上后, 这个包大概有70个字节长,

如果dcd是打开的, 当定时器的时间到了之后, 在跟踪文件里会看到探测包. 在unix系统下, 可以用:

tail -f svr_;.trc 查看.

了解dcd的问题和局限

在很少的问题报告中, 最值得注意的是dcd在windosnt下很差的性能, 死联接只有在服务起重启或者数据库重启的情况下被清除. dcd在nt下怎样正确的工作依靠客户端的协议. sql*net v2.3 比其他发行版改进了一些性能。

见bug#303578

在sco unix下, 有个问题是 当dcd定时器到时后, 服务进程死循环, 消耗了大量的cpu资源, 这个问题是由于不正确的信号处理造成的,  可以禁止dcd来解决

见bug#293264

如果只是客户应用结束, 孤儿进程的资源不会被释放, 只有当客户端重启之后, dcd才是放这些资源, 例如, windows应用被杀掉, 客户端仍在运行, 探测包可以被收到, 像进程仍然活动着一样被丢掉. 看起来好像dcd检测客户端机器, 而不是客户端进程.

见bug#280848

dcd依靠探测包来检测联接, 所以在半双工的网络协议中, 这是不可能的, 所以dcd在appc/lu6.2 等半双工协议下不能用.

内网联接是用beq协议不能支持dcd, ipc协议可以使用

dcd 在协议层是很消耗资源的, 所以如果要用dcd来清除死进程, 会加重系统的负担, 任何时候, 干净的退出系统, 这是首要的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DCDDCDU是汇编语言中常用的两个伪指令,它们的区别在于: 1. DCD用于定义一个或多个字(16位),而DCDU用于定义一个或多个双字(32位); 2. DCD的数据可以是十六进制数、十进制数或字符,但是DCDU只能是十六进制数或字符; 3. DCD的数据在存储器中按照字的顺序存放,而DCDU的数据按照双字的顺序存放。 下面是一个简单的示例程序,用来验证DCDDCDU的区别: ``` section .data my_data: DCD 0x1234, 5678, 'A', 0xFFFF DCDU 0xABCDEF12, 'B', 0x87654321 section .text global _start _start: ; 输出my_data中的数据 mov esi, my_data mov ecx, 6 print_loop: mov eax, [esi] call print_hex call print_nl add esi, 4 loop print_loop ; 退出程序 mov eax, 1 xor ebx, ebx int 0x80 ; 打印一个十六进制数 print_hex: push ebx push edx mov ebx, 0x10 mov edx, 0 hex_loop: xor edx, edx div ebx push dx cmp eax, 0 jne hex_loop print_loop: pop eax add al, '0' cmp al, '9' jle print_char add al, 7 print_char: call print_char_stdout cmp esp, ebp jne print_loop pop edx pop ebx ret ; 打印一个字符到标准输出 print_char_stdout: push eax mov eax, 4 mov ebx, 1 mov ecx, esp mov edx, 1 int 0x80 add esp, 4 ret ; 打印一个换行符到标准输出 print_nl: push eax mov eax, 4 mov ebx, 1 mov ecx, nl mov edx, 1 int 0x80 pop eax ret section .data nl db 0x0A ``` 这个程序定义了一个名为my_data的数据段,其中包含了一些字和双字数据。在程序的主函数_start中,我们首先将my_data的起始地址存放在esi寄存器中,然后使用一个循环输出my_data中的所有数据。在输出每个数据之前,我们先将它存放在eax寄存器中,然后调用print_hex函数将它以十六进制形式打印到标准输出上。最后,我们调用print_nl函数打印一个换行符,以便下一个数据可以从新的一行开始输出。 如果我们编译并运行这个程序,它会输出以下内容: ``` 3412 16DE 41 FFFF 12EFCDAB 42 21365487 ``` 可以看到,DCDDCDU定义的数据在存储器中的顺序是不同的,而且DCDU定义的数据都是双字,而DCD定义的数据都是字。此外,DCD可以定义字符类型的数据,而DCDU只能定义十六进制数和字符。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值