第三章 WebSphere管理处理错误
本章节将向你说明管理性处理对websphere环境的影响(如:Deployment Manager或者NodeAgent错误,也包括有计划的down机处理)。因为Deployment Manager 和Node Agent在WebSphere环境中不能自动的实现failover,所以被视为单点故障。
但是在读完本章之后,你会发现这些管理处理错误并不是致命的。you can live with an outage for a certain amount of time。
如果你不能承受这样的错误,你可以通过高可靠性集群软件来解决这个问题,如:IBM_HACMP,IBM Tivoli,VERITAS Cluster Server,SUN Cluster.第五章对这部分内容有详细的论述。
应用服务器错误不再本章讨论。这一部分内容见第二章“WebSphere Application failover and recovery”
3.1. 处理错误的介绍
Node Agent和Deployment Manager在WebSphere环境中都是管理性处理,它们的一个主要工作是保持配置文件的数据同步。Node Agent和Deployment Manager都在它们的节点上使用XML文件库,主文件库保存在Deployment Manager节点上,主文件库数据会被复制到每一个cell的节点中,缺省的复制周期为60秒,数据复制是从Deployment Manager向Node Agent单向复制以保证数据的可靠性,这意味着Node Agent上的任何配置修改都将是临时的,下一次的数据同步将会覆盖当前的配置,只有通过Deployment Manager修改主数据才能够生效并同步到每一个节点。
另外,Depolyment Manager涉及Tivoli Performance,Backup clusters,JMX routing,distributed logging,naming Server以及security Server相关内容,解决Deployment Manager错误涉及多个WebSphere系统组件,见3.2”Deployment Manager failure”.
除了支持文件同步服务,Node agent还对LSD(Location Service Daemon),JMX Server,Distributed logging,Naming server,security server提供支持,最后nodeagent在应用服务器启动时是必须的。详细信息见3.3“Node Agent failures“。
3.2. Deployment manager failure
Deployment Manager不做集群处理,所以在整个环境中是一个单点故障,但它对应用的影响是有限的,因为cell中的所有配置数据都是被同步的,所有的节点在Deployment Manager恢复正常之后会自动的发现它,并恢复原有的功能。
在V6中Deployment Manager在运行时的作用已经不再像以前的版本那么重要了,V6中Deployment Manager不负责J2EE应用、消息引擎的路由,路由逻辑V6版本中有指定的集群成员负责,如果该成员发生故障,HaManager将指定另外一个成员继续工作,路由工作在V6中也变得可以容错了。但是以下工作还是需要Deployment Manager的参与。
修改配置,同步cell中的配置。
Ø Deployment Manager是所有的管理工作、配置工作和操作的控制中心,Deployment Manager负责管理整个Cell的配置。
Ø Jmx通过Deployment Manager管理应用服务器和集群;向一个集群上发布应用等等。
这些配置可以在NodeAgent和应用服务器上通过wasadmin命令行直接进行配置,但是这些配置不是永久性的,Deployment Manager恢复可用后会用配置库中的信息覆盖当前的信息。见3.2.9 “Administrative client”,JMX和分布管理见“WebSphere Application server V6 System Management and configuration Handbook”
Ø 性能监控
在v6中集成了Tivoli Performance Viewer。
Ø 备份集群的容错。见2.7“backup cluster support“
错误原因
引起Deployment Manager错误的原因主要包括以下几种:
Ø 可预期的服务器处理错误,比如停止服务器。
Ø 非预期的服务器处理错误,比如使用kill -9停止JVM
Ø 服务器网络问题,比如网线没有连接或者路由器发生故障
Ø 非预期的机器故障,比如机器停机、操作系统故障、或者电源故障。
Ø 磁盘错误导致配置信息无法读取。
下面的章节将讨论Deployment Manager错误现象以及怎样减少这些错误对WebSphere环境的影响。
3.2.1. 配置管理
在v5版本中所有的节点是“添加“到Deployment Manager cell。Deployment Manager在XML文件库中保存了所有的配置信息,配置信息的子集被复制到cell中的节点,Deployment Manager中保存着所有被同步的配置信息,在日常的操作中Deployment Manager既要向每个节点同步配置信息也要向节点同步二进制的应用。
你可以通过配置来可以打开或者关闭配置信息的同步(Administration->Node Agents->Node_Agent_Name->File synchronization service).
to be continue.......
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/24830066/viewspace-677584/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/24830066/viewspace-677584/