数据库管理 2022-10-10
第三十八期 一体机上不了网了
刚刚给祖国母亲庆完生,体验了一把7天过的多快(我节前还休了2天年假,耍了9天),马上就开始体验7天过得有多慢(万恶的调休!)。
本期其实是节前恢复一体机系统后添加备份网络时发现的一个问题(其实以前在另一台一体机就没搞成功,备份走的生产网络)。
技术向,知道写了些啥。
1 咋发现的?
继搞挂一体机一计算节点修复完成后,并且将网络光衰问题(主要是单模过跳纤架)解决以后。紧接着就开始添加数据库的备份网络了,然而按照下面的配置完成配置并启动网卡后出现了一些问题:
cd /etc/sysconfig/network-scripts
cat ifcfg-eth10
#### DO NOT REMOVE THESE LINES ####
#### %GENERATED BY CELL% ####
DEVICE=eth10
BOOTPROTO=none
ONBOOT=yes
HOTPLUG=yes
IPV6INIT=no
IPADDR=10.xxx.xx.249
NETMASK=255.255.255.0
NETWORK=10.xxx.xx.0
GATEWAY=10.xxx.xx.1
BROADCAST=10.xxx.xx.255
主要问题是,这台机器通过eth10网卡只能和通网段内IP通信,同时其他网段的机器无法与这台机器通信。
2 啥问题?
虽然我不是专门的Linux运维工程师,但毕竟当年还是在培训机构讲过主机课程,RHCE的技能水平还是大差不差的(容我自夸一下)。以前配置网络确实是网卡配置好了就能上网了。因此我想了下是不是网关、路由的问题,通过route -n查看确实只有默认的生产网络网关。尝试添加网关:
route add -net 10.xxx.xx.0/24 gw 10.xxx.xx.1
问题依旧。
3 怎么整?
既然是一体机,这时候又想到了MOS后台一体机组的小姐姐了,果断微信问之,果然效果很好,直接甩了俩文档过来:
Configuring Exadata Database Server and ZDLRA Routing (Doc ID 1306154.1)
Configuring Exadata Database Server Routing ( Doc ID 1306154.1 )
根据文档,进行了一些检查:
ip rule list
0: from all lookup local
32756: from all to 10.xxx.x2.192/26 lookup 219
32757: from 10.xxx.x2.192/26 lookup 219
32758: from all to 192.xxx.xx.2 lookup 181
32759: from 192.xxx.xx.2 lookup 181
32760: from all to 192.xxx.xx.1 lookup 180
32761: from 192.xxx.xx.1 lookup 180
32764: from all to 10.xxx.x.2 lookup 220
32765: from 10.xxx.x.2 lookup 220
32766: from all lookup main
32767: from all lookup default
ip route list
default via 10.XXX.X2.193 dev bondeth0 proto static metric 300
10.xxx.x2.192/26 dev bondeth0 proto kernel scope link src 10.xxx.x2.204 metric 300
10.xxx.x.0/27 dev eth0 proto kernel scope link src 10.xxx.x.2 metric 100
192.xxx.x.0/22 dev re0 proto kernel scope link src 192.xxx.xx.1 metric 101
192.xxx.x.0/22 dev re1 proto kernel scope link src 192.xxx.xx.2 metric 102
并没有网卡eth10的相关路由信息,因此需要添加:
cd /etc/sysconfig/network-scripts/
cat rule-eth10
from 10.xxx.xx.249 table 230
to 10.xxx.xxx.249 table 230
cat route-eth10
10.xxx.xx.0/24 dev eth10 table 230
default via 10.xxx.xx.1 dev eth10 table 230
##这里需要注意,table编号需要与其他rule和route区分
ip rule add from 10.108.83.249 table 230
ip rule add to 10.108.83.249 table 230
ip route add 10.108.83.0/24 dev eth10 table 230
ip route add default via 10.108.83.1 dev eth10 table 230
##即时生效
再次检查:
ip rule list
..
32762: from all to 10.xxx.xx.249 lookup 230
32763: from 10.xxx.xx.249 lookup 230
..
ip route list
..
10.xxx.xx.0/24 dev eth10 proto kernel scope link src 10.xxx.xx.249 metric 103
..
已经有网卡eth10相关网关、路由信息了,网络检查本机可以出去了,其他网段机器也可以访问了,问题解决!
总结
说真的,感觉和上一期比较类似,又是一个很难得遇到的问题,确实是一般配置中不会出现的,通过ip命令去添加规则和路由。
老规矩,知道写了些啥。