与银联数据中心连接的两条client端通讯链路全部断开后平台没有再重新建立client链路与银联数据中心通信(CSP平台内部机制会在子进程异常退出时再重新拉起新的服务代替异常退出的服务),导致之后所有发往银联前置的交易失败,即ATM他带本和本代他交易失败。
1、 针对上述两条链路断开出现的原因有如下分析:
a、2012-XX-XX号10:56:22左右,银联前置调用上核心的806001交易,出现CICS超时(ECI_ERR_RESPONSE_TIMEOUT),导致上核心的这个CICS通讯服务器退出(详见com_R_34_844286.log),根据CSP设计机制,任何进程池的服务进程退出其父进程都会重新拉起一个新的服务进程取代已经退出的进程来为后续的交易提供服务,因为上述上核心的服务进程因CICS响应806001交易超时退出,导致CSP主动拉起新的服务进程代替已经退出的进程。
b、在CSP平台拉起上核心的服务进程cspcomhostcicscli时,cspcomhostcicscli会主动访问数据库,但是此时与数据库连接的应用程序已经达到最大数目,即CSP平台新拉起的上核心的cspcomhostcicscli服务进程报sqlcode:-1040,导致新拉起的cspcomhostcicscli服务退出,从而导致CSP平台不停的循环重新拉起cspcomhostcicscli服务的动作,直到2012-XX-XX号11:07:30左右cspcomhostcicscli父进程发生系统调用阻塞(此过程中数据库连接的应用程序一直是最大数目