今天在上海听老农的HACMP课时,讲到了AIX中的多路径路由,并做了相关实验。通过实验和LU的相关帖子总算明白了其中的道理。帖子中LARRYH的讲解很细致。
问题:
AIX5.3+hacmp5.4网络相关的问题
两台p550的小型机装了AIX5.3.0.5,
HACMP 版本是5.4.0.1,各有一块光纤网卡和一块内置千兆以太网卡连接到集群网络IP_network_01中。
IP规划如下,24位掩码
10.10.10.1 数据库服务器的boot1地址
10.10.20.1 数据库服务器的boot2地址
10.10.10.2 应用服务器的boot1地址
10.10.20.2 应用服务器的boot1地址
192.168.2.10 数据库服务器的persistent ip
192.168.2.20 应用服务器的persistent ip
192.168.2.11 资源组1的service ip
192.168.2.21 资源组2的service ip
网关都是192.168.2.254
现在遇到2个问题
1,persistent ip不会自动漂移
如 果persistent ip所在的网卡上没有service ip,那么把这块网卡的网线拔掉后persistent ip不会自动漂移;如果网卡上有service ip,那么把这块网卡的网线拔掉后persistent ip会跟着service ip一起漂移到另一块网卡上
2,网关丢失
ip地址漂移后网关丢失了,不是192.168.2.254,而是127.0.0.1
各位有遇到过这个问题么?或者有什么解决思路?
IP规划如下,24位掩码
10.10.10.1 数据库服务器的boot1地址
10.10.20.1 数据库服务器的boot2地址
10.10.10.2 应用服务器的boot1地址
10.10.20.2 应用服务器的boot1地址
192.168.2.10 数据库服务器的persistent ip
192.168.2.20 应用服务器的persistent ip
192.168.2.11 资源组1的service ip
192.168.2.21 资源组2的service ip
网关都是192.168.2.254
现在遇到2个问题
1,persistent ip不会自动漂移
如 果persistent ip所在的网卡上没有service ip,那么把这块网卡的网线拔掉后persistent ip不会自动漂移;如果网卡上有service ip,那么把这块网卡的网线拔掉后persistent ip会跟着service ip一起漂移到另一块网卡上
2,网关丢失
ip地址漂移后网关丢失了,不是192.168.2.254,而是127.0.0.1
各位有遇到过这个问题么?或者有什么解决思路?
larryh的解答:
楼上第一句意思是:
在别名IPAT环境下,persistent ip可以与别名服务IP在相同或不同子网,但必须与所有BOOT IP不同子网。
这句话与LZ的第一个问题没有关系。
其实我认为第一个现象非常正常: HACMP 尽 量避免同一子网有多个网卡的状态出现,从而避免多路径路由出现,导致一些莫名其妙的情况:如果不把Persistent IP和同一子网的服务IP放在一块网卡上,那么当Persistent IP网卡断开的时候,服务IP上将会出现丢一半包的状态(缺省多路径路由情况下),这时候服务网卡并未断开,所以不会切换,但应用服务将无法正常工作。
在同一子网两个网卡情况下,当网卡断开,会有3种可能:
1、AIX 5L缺省状况,即多路径路由打开,其中一块网卡断开,另外一块网卡必然不能正常工作——丢一半的包,如果是更多网卡在同一子网,丢1/N的包,N=网卡数量,结果就是:所有同一子网网卡全部不能正常为应用服务。
2、AIX 5L非缺省情况,即多路径路由功能关闭,也等同于AIX 4及以前的状况,会有两种结果:断开的网卡带着到本子网的路由,那么全部包丢掉,所有本子网网卡不能正常工作;断开网卡不带本子网的路由,那么断开的网卡不能工作,其他本子网网卡正常工作。
总之,让不同网卡在同一子网,当有网卡断开时,后果是不可预料的,所以没什么特别的好处。
至于后者,应当是BUG。 HACMP 自古以来就经常有不能正确判断路由应当保持并切换到合适的网卡上的BUG
IP协议正常通讯,无时无刻不依赖路由,而不是很多人理解的那样,只有到远程子网才需要路由。路由不等于路由器。唯一不需要路由直接可达的地址只有127.0.0.1
不信随便一台机器,不管什么UNIX平台,甚至是WINDOWS,netstat -rn看看,到任何一块本机网卡,都有路由,只是网关是127.0.0.1。到任何一个本地子网,都有至少一个路由,在这个本地子网上的本机IP就是其网 关,如果这条路由没有,本机挂着IP也不能与本地子网通讯,当然,操作系统正常情况下不会出现这种状态——因为在配置网卡IP的时候操作系统自动就给它加 上这条路由了,且正常情况下无法删除,除非操作系统有问题,路由管理紊乱了。
不信随便一台机器,不管什么UNIX平台,甚至是WINDOWS,netstat -rn看看,到任何一块本机网卡,都有路由,只是网关是127.0.0.1。到任何一个本地子网,都有至少一个路由,在这个本地子网上的本机IP就是其网 关,如果这条路由没有,本机挂着IP也不能与本地子网通讯,当然,操作系统正常情况下不会出现这种状态——因为在配置网卡IP的时候操作系统自动就给它加 上这条路由了,且正常情况下无法删除,除非操作系统有问题,路由管理紊乱了。
转贴地址: http://skilaqi.blog.sohu.com/112072679.html