路由策略数据库的规则用于控制选择路由的算法。
Internet上采用的路由算法一般是基于数据包目的地址的。理论上,也可以由TOS域决定,不过这没有实际应用。要了解经典路由算法的详细情况请参考RFC-1812。
而在某些情况下,我们不只是需要通过数据包的目的地址决定路由,可能还需要通过其他一些域:源地址、IP协议、传输层端口甚至数据包的负载。这就叫做:策略路由(policy
routing)。
注意:策略路由(policy
routing)不等于路由策略(rouing policy)。
在这种情况下,传统的基于目的地址的路由表就无法满足要求了,需要使用路由策略数据库(routing
policy database,RPDB)代替,通过它选择执行某些路由。这些规则可以由很多不同的状态,而且它们没有天生的次序,要由系统管理员决定。RPDB可以
匹配以下的域:
数据包的源地址;
数据包的目的地址;
服务类型(Type of
Service);
进入的网络接口;
匹配IP协议和传输层端口也是可能的,不过这要依靠iptables或者ipchains通过fwmark为某些数据包做标记,并重定向。
每个路由策略由一个选择符(selector)和一个操作(action)组成。系统按照顺序搜索路由策略数据库,把选择符和{源地址、目的地址、进入
接口、tos、fwmark}等关键词进行匹配,如果匹配成功,就执行action定义的操作。操作或者成功返回,或者失败并且中止对路由策略。否则,系
统继续查询路由策略数据库。
操作如何定义?最原始的操作是选择下一跳(nexthop)和输出设备(output
device)。Cisco IOS使用这种方式,我们姑且把这叫做匹配并设置(match &
set)。而Linux的方式则更为灵活,Linux允许的操作包括:基于目的地址的路由表查询以及按照最长匹配的原则从路由表中选择路由。因此,匹配并
设置(match & set)的方式只是一个最简单的特例而已。
在系统启动时,内核会为路由策略数据库配置三条缺省的规则:
优先级 选择符 操作 解释
local是我们最常使用的路由表,默认的路由表
0 匹配任何条件 查询路由表local(ID 255)路由表local是一个特殊的路由表,包含对于本地和广播地址的高优先级控制路由。rule 0非常特殊,不能被删除或者覆盖。
32766 匹配任何条件 查询路由表main(ID 254) 路由表main(ID 254)是一个通常的表,包含所有的无策略路由。系统管理员可以删除或者使用
另外的规则覆盖这条规则。
32767 匹配任何条件 查询路由表default(ID 253) 路由表default(ID
253)是一个空表,它是为一些后续处理保留的。对于前面的缺省策略没有匹配到的数据包,系统使用这个策略进行处理。这个规则也可以删除。
不要混淆路由表和策略:规则指向路由表,多个规则可以引用一个路由表,而且某些路由表可以没有策略指向它。如果系统管理员删除了指向某个路由表的所有规则,这个表就没有用了,但是仍然存在,直到里面的所有路由都被删除,它才会消失。
8.3.规则类型
路由策略规则数据库可以包括如下类型的规则:
unicast
返回从被引用的路由表中发现的路由。
blackhole
丢弃数据包,不做任何反应。
unreachable
产生网络不可达(Network is unreachable)的ICMP错误信息 。
prohibit
产生通讯被禁止(Communication is administratively prohibited)的ICMP错误信息。
nat
把数据报的源地址转换为其它的值。详情请参考附录C。
8.4.命令
add、delete、show(或者list)
8.5.ip rule add -- 插入新的规则。
ip rule delete --
删除规则。
缩写:add、a;delete、del、d
参数
type TYPE(default):
这个规则的类型。有效的类型上一节已经介绍过了。
from PREFIX: 匹配的源地址
iif NAME:
选择数据包进入的设备。如果接口是回环设备,这个规则就只匹配源于本机的数据包。这意味着,你可以为本机发出的数据包和要转发的数据包分别建立路由表,使两者完全隔离。
tos TOS或者dsfield
TOS: 选择匹配的TOS值
fwmark MARK:
选择要匹配的fwmark值
priority PREFERENCE:
设置这个规则的优先级。每个规则的优先级都应该明确设置为一个唯一的数值。实际上,由于历史的原因,ip roule
add命令无需任何优先级的值,也不必是唯一的。如果用户没有在命令中提供优先级的值,内核会自动选择。如果用户提供的优先级值已经存在,内核也不会拒绝这次请求,而是在相同优先级的规则前面插入新的规则。
table TABLEID:
如果规则选择符匹配,就被查询的路由表识别符。
realms FROM/TO:
如果规则匹配和路由表查询成功,选择的realms值。
nat ADDRESS:
设置要进行网络地址转换的IP地址段。ADDRESS或者是进行网络地址转换ip地址段,或者是一个本机地址,甚至可以是0。
警告:使用上面两个命令对路由策略数据库进行的任何修改都不会马上生效。只有使用ip
route flush cach命令刷新路由缓存之后才会生效。
示例
通过路由表inr.ruhep路由来自源地址为192.203.80/24的数据包
ip ru add from
192.203.80/24 table inr.ruhep prio 220
把源地址为193.233.7.83的数据报的源地址转换为192.203.80.144,并通过表1进行路由
ip ru add from
193.233.7.83 nat 192.203.80.144 table 1 prio 320
删除无用的缺省规则
ip ru del prio 32767
注:32767和32766都可以删除,而0是不可以删除的。
8.7.ip rule show -- 列出路由规则
缩写:show、list、sh、ls、l
参数
好消息,这个命令没有参数。
输出格式
kuznet@amber:~ $ ip
ru ls
0: from all lookup
local
200: from
192.203.80.0/24 to 193.233.7.0/24 lookup main
210: from
192.203.80.0/24 to 192.203.80.0/24 lookup main
220: from
192.203.80.0/24 lookup inr.ruhep realms inr.ruhep/radio-msu
300: from
193.233.7.83 to 193.233.7.0/24 lookup main
310: from
193.233.7.83 to 192.203.80.0/24 lookup main
320: from
193.233.7.83 lookup inr.ruhep map-to 192.203.80.144
32766: from all
lookup main
kuznet@amber:~ $
每行第一部分的数字是规则的优先级,接着是选择符。
关键词lookup后面接着路由表识别符。
如果规则要进行网络地址转换,还需要一个关键词map-to设置转换以后的地址。
上面的示例非常简单,192.203.80.0/24和193.233.7.0/24组成内部网络,但是它们向外发送数据包要通过不同的路由。主机193.233.7.83和外界会话时,地址需要转换为192.203.80.144。
linux的路由表与路由策略
ip route 只是基于目的地址的路由选择
ip rule
路由策略,控制路由选择,可根据源地址,源IP等进行路由选择
路由策略由选择符合操作组成
ip rule add 添加策略
ip rule delete 删除策略
ip rule show 显示策略
使用路由策略可以更好的控制路由走向,类似于cisco下的
route map
下面一个例子显示了使用路由策略的优点:
假设有一台双线服务器
有两张网卡,有电信IP和网通IP地址,实现电信IP访问服务器时,服务器响应使用电信网关,网通IP访问服务器时,服务器响应使用网通网关。
假设电信IP为
222.73.121.100/24 网关
222.73.121..1
网通IP
112.80.1.100/24 网关
112.80.1.1
方法1(静态路由方法):
A.
使用电信网关做默认路由,并添加网通的路由条目,并将条目写到/etc/rc.local或者/etc/sysconfig/network里面,以开机时可以加载
在network里面添加GATEWAY=222.73.121.1
添加路由条目如下
route add –net
58.16.0.0/13 gw 112.80.1.1
…..
B.
每网卡路由:假设eth0为222.73.121.100/24,eth1为112..80.1.100/24,新建以下文件
/etc/sysconfig/network-scripts/route-eth1
按如下格式添加路由条目
58.16.0.0/13 via
112.80.1.100
缺点是需要添加很多条目的路由条目,并且需要更新,如果有一个网通网段未添加,这个网段的IP就不能访问服务器的。
方法2(根据用户访问的路径设置静态路由):
1.
先在/etc/sysconfig/network里面添加默认路由GATEWAY=222.73.121.1
2. 设置ip rule 策略
vi
/etc/iproute2/rt_tables #添加路由表
[root@lamp
iproute2]# cat rt_tables
#
# reserved values
#
255 local
254 main
253 default
0 unspec
252 dianxin
#电信路由表
251 wangtong
#网通路由表
#
# local
#
#1 inr.ruhep
3. 添加原路返回路由
ip route
flush table dianxin
ip route
add default via 222.73.121.1 dev eth0
src 222.73.121.100 table dianxin
ip rule
add from 222.73.121.100 table
dianxin
ip route flush table
wangtong
ip route
add default via 112.80.1.1 dev eth1 src 112.80.1.100 table wangtong
ip rule
add from 112.80.1.100
table wangtong
即让从电信IP过来的请求按照电信路由返回,从网通IP过来的请求从网通路由返回
将上述命令添加至/etc/rc.local中,以便重启可以生效
[root@lamp ~]# ip
rule show
0: from all lookup 255
32764: from
112.80.1.100 lookup wangtong
32765: from
222.73.121.100 lookup dianxin
32766: from all
lookup main
32767: from all
lookup default
ip
rule show显示的内容,大体上可以分为三段:
第一段:冒号之前的数字,表示该路由表被匹配的优先顺序,数字越小,越早被匹配。这个优先级别范围是0~4亿多。默认0、32766、32767三个优先级别已被占用。如果在添加规则时没有定义优先级别,那么默认的优先级别会从32766开始递减,可以通过prio ID参数在设置路由表时添加优先级。
第二段:from关键字,这里显示的是匹配规则,当前表示的是从哪里来的数据包,除了from关键字外,还有to、tos、fwmark、dev等等。
第三段:loacl/main/default这些都是路由表名称,表示数据包要从那个路由表送出去。local表包含本机路由及广播信息,main表就是我们route -n看到的内容,default表,默认为空。
重启网络服务可以看到路由策略生效,当然,client的访问到达server之前是需要智能DNS解析的功能来选择不同的到达路径的。
添加rule以180.95.233.130/32为源的IP走路由表1111
ip rule add from
180.95.233.130/32 table 111
Ip rule
add from 180.95.233.130/32 table 111 pref 100
pref即路由表内序号,如果不加pref,则将在已有的规则最小序号前插入
ip rule add from
192.168.82.1 table tel2 pref 100
[root@zebra ~]# ip
rule sh
0: from all lookup local
100: from 192.168.82.1 lookup tel2
32762: from 192.168.82.1 lookup tel2
为路由表111添加默认路由180.95.233.129
ip
route add 0/0(default)via
180.95.233.129 table 111
Linux下不等价负载
实现linux下使用默认路由的weight来控制去每个出口的流量比例
1、全局路由表下生成两条负载默认路由
ip
route add default scope global
nexthop via $P1 dev $IF1 weight 1
nexthop via $P2 dev
$IF2 weight 1
Ip rout
sh
default
nexthop via 192.168.81.2 dev eth2.801 weight 1
nexthop via 192.168.82.2 dev eth2.802 weight 1
这样生成了两条等价的负载路由
2、在指定路由表中生成两条默认路由
ip rout change default table 1881
nexthop via
10.222.22.1 dev p1p2.222
nexthop via
10.16.16.1 dev p1p2.111
[root@JXCN-ZLCS-NAT
~]# ip rout sh table 1881
default
nexthop via 10.222.22.1 dev p1p2.222 weight 1
nexthop via 10.16.16.1 dev p1p2.111 weight 1
删除默认路由
ip rout del default
根据网卡设备决定路由表
用于将不同接口进来的数据包走指定的路由表。
ip rule add dev eth0
table tel
ip rule add dev eth1
table tel2
将流量定向走指定路由表
/sbin/vconfig add
eth3 198
/sbin/ifconfig
eth3.198 10.101.98.2/30
/sbin/vconfig add
eth0 298
/sbin/ifconfig
eth0.298 172.22.98.1/30
ip rout add default via 172.22.98.2 table 2298创建table2298
ip rule add dev eth3.198 table 2298流量入口
ip rule add dev eth0.298 table 2298流量出口
ip rout add
223.103.5.0/24 via
10.101.98.1 table 2298回程路由
ip rout add 223.104.5.0/24 via 10.101.98.1 table 2298
验证配置
[root@zebra ~]# ip
rule sh
0: from all lookup local
32762: from all iif
eth1 lookup tel2
32763: from all iif
eth0 lookup tel
32764: from 192.168.82.1 lookup tel2
32765: from 192.168.81.1 lookup tel
32766: from all lookup main
32767: from all lookup default
将接口从指定路由表中删除
ip rule del dev eth1
table tel2
根据目标IP决定路由表
将一些目标IP指定从哪些出口走
ip rule add to
220.181.75.1 table tel2
验证
[root@zebra ~]# ip
rule sh
0: from all lookup local
32763: from all to220.181.75.1lookup tel2
32764: from 192.168.82.1 lookup tel2
32765: from 192.168.81.1 lookup tel
32766: from all lookup main
32767: from all lookup default
根据源IP决定路由表
基于源IP的路由,相当于PBR
ip rule add from
192.168.82.1 table tel2
验证配置
[root@zebra ~]# ip
rule sh
0: from all lookup local
32762: from 192.168.82.1 lookup tel2
删除策略
ip rule delfrom
192.168.82.1 table tel2
删除路由条目的几种方法
根据明细条目删除
iprule del from 192.168.10.10
根据优化级删除
iprule del prio 32765
根据路由名称来删除
iprule del table tel2
查看链路信息
ip link show
查看IP配置信息
ipaddrshow
查看arp缓冲表
ip neighbor show
[root@zebra ~]# ip
neighbor show
103.246.132.77 dev
eth0 lladdr 28:10:7b:54:f2:d1 REACHABLE
103.246.132.244 dev
eth0 lladdr 00:0c:29:40:24:1d REACHABLE
192.168.82.2 dev
eth2.802 lladdr 80:f6:2e:8d:39:b2 REACHABLE
192.168.81.2 dev
eth2.801 lladdr 80:f6:2e:8d:39:b1 REACHABLE
删除邻居的MAC缓存
ip neighbor del
103.246.132.130 dev eth0
[root@zebra ~]# ip
nei sh
103.246.132.130 dev
eth0 FAILED
基于协议和端口进行流量分割
1、iptables -t mangle -A PREROUTING -i
eth0.101 -p TCP --dport 80 -j MARK --set-mark 8080
eth0.101接口进来的流量目的端口为80的打标,8080
2、ip rout add default via 172.25.77.2 table
2577
创建路由表
3、ip rule add fwmark 8080 table 2577
将MARK为8080的指定到路由表2577