1、网络层的功能
主要任务是把分组从源端传到目的端,为分组交换网上的不同主机提供通信服务。网络层传输单位是数据报
- 路由选择(最佳路径)与分组转发
- 异构网络互联
- 拥塞控制:若所有结点都来不及接受分组,而要丢弃大量分组的话,网络就处于拥塞状态。因此有必要采取一定措施缓解这种拥塞。
2、IPV4
2.1 IPv4分组的格式
TCP/IP协议栈
一个IP分组由首部和数据两部分组成。首部前一部分的长度固定,共20B,是所有IP分组必须具有的。可选字段,长度可变,用来提供错误检测及安全等级制。
版本 | 指IP的版本 |
---|---|
首部长度 | 占4位,以4B为单位,最小为5最大为60B |
区分服务 | 指示期望获得哪种类型的服务。 |
总长度 | 指首部和数据之和的长度,单位为字节,占16位,因此数据报的最大长度为2^16-1=65535B。以太网的最大传送单元(MTU)为1500B,因此当一个数据报封装成帧时,一定不能超过数据链路层的MTU值 |
标识 | 占16位。当一个数据报的长度超过网络的MTU时,必须分片,同一数据报的分片使用同一标识。 |
标志 | 占3位。只有两位有意义X_ _。中间位DF(Don’t Fragment):DF=1,禁止分片;DF=0,允许分片。最低位MF (More Fragment) :MF=1,后面“还有分片,”MF=0,代表最后一片/没分片 |
片偏移 | 占13位。指出较长分组分片后,某片在原分组中的相对位置。以8B为偏移单位。既每个分片的长度一定是8B的整数倍(最后一个分片除外) |
生存时间 | 占8位,IP分组的保质期,经过一个路由器-1,变成0则丢弃 |
协议 | 占8位。指出此分组携带的数据使用何种协议 |
首部校验和 | 占16位。只校验分组首部,而不校验数据部分 |
源地址 | 占4B。标识发送方的IP地址 |
目的地址 | 占4B。标识接收方的IP地址 |
可选字段 | 0~40B ,用来支持排错、测量以及安全等措施。 |
填充 | 全0,把首部补成4B的整数倍。 |
2.2 IP数据报分片
最大传送单元MTU(链路层数据帧可封装数据的上限),以太网的MTU是1500字节。
如果所传送的数据报长度超过某链路的MTU值,那么就应该进行分片。
2.3 IPv4地址
IP地址:全世界唯一的32位/4字节标识符,标识路由器主机的接口。IP地址::={<网络号>,<主机号>}
分类的IP地址,目的是合理的划分IP地址的资源
特殊IP地址
私有IP地址
2.4网络地址转换(NAT)
网络地址转换是指通过将专用网络地址转换为公用地址从而对外隐藏内部管理的IP地址。路由器对目的地址是私有IP地址的数据报一律不进行转发。
网络地址转换NAT(Network Address Translation):在专用网连接到因特网的路由器上安装NAT软件,安装了NAT软件的路由器叫NAT路由器,它至少有一个有效的外部全球IP地址。
2.5 子网划分与子网掩码
2.5.1 背景
分类的IP地址的弱点:
1.IP地址空间的利用率有时很低。
2.两级IP地址不够灵活。
2.5.2 子网划分
2.5.3 子网掩码
2.5.4 无分类编址CIDR
CIDR记法:IP地址后加上“/”,然后写上网络前缀(可
以任意长度)的位数。 e.g. 128.14.32.0/20。CIDR把网络前缀都相同的连续的IP地址组成一个“CIDR地址块”。
1.消除了传统的A类,B类和C类地址以及划分子网的概念。
2.融合子网地址与子网掩码,方便子网划分。
应用:构成超网、最长前缀匹配
将多个子网聚合成一个较大的子网,叫做构成超网,或路由聚合。方法:将网络前缀缩短(所有网络地址取交集)。
最长前缀匹配:使用CIDR时,查找路由表可能得到几个匹配结果(跟网络掩码按位相与),应选择具有最长网络前缀的路由。前缀越长,地址块越小,路由越具体。
2.6 ARP、DHCP、ICMP
2.6.1 地址解析协议(ARP)
ARP协议:完成主机或路由器IP地址到MAC地址的映射(解决下一跳走哪的问题)
ARP协议使用过程: 检查ARP高速缓存,有对应表项则写入MAC帧,没有则用目的MAC地址为FF-FF-FF-FF-FF-FF的帧封装并广播ARP请求分组,同一局域网中所有主机都能收到该请求。目的主机收到请求后就会向源主机单播一个ARP响应分组,源主机收到后将此映射写入ARP缓存(10-20min更新一次)
ARP协议4种典型情况:
1.主机A发给本网络上的主机B:用ARP找到主机B的硬件地址;
2.主机A发给另一网络上的主机B:用ARP找到本网络上一个路由器(网关)的硬件地址;
3.路由器发给本网络的主机A:用ARP找到主机A的硬件地址;
4.路由器发给另一网络的主机B:用ARP找到本网络上的一个路由器的硬件地址。
注意:ARP协议是自动进行的
2.6.2 动态主机配置协议(DHCP)
动态主机配置协议DHCP是应用层协议,使用客户/服务器方式,客户端和服务端通过广播方式进行交互,基于UDP。
DHCP提供即插即用联网的机制,主机可以从服务器动态获取IP地址、子网掩码、默认网关、DNS服务器名称与IP地址,允许地址重用,支持移动用户加入网络,支持在用地址续租。
DHCP服务器分配给DHCP客户的IP地址是临时的,因此DHCP客户只能在一段有限的时间内使用这个分配到的IP地址
2.6.3网际控制报文协议(ICMP)
目的:为了提高IP数据报交付成功的机会,在网络层使用ICMP来让主机或路由器报告差错和异常情况。
ICMP差错报告报文
- 终点不可达:当路由器或主机不能交付数据报时就向源点发送终点不可达报文。(无法交付)
- 源点抑制:当路由器或主机由于拥塞而丢弃数据报时,就向源点发送源点抑制报文,使源点知道应当把数据报的发送速率放慢。(拥塞丢数据)
- 时间超过:当路由器收到生存时间TTL=0的数据报时,除丢弃该数据报外,还要向源点发送时间超过报文。当 终点在预先规定的时间内不能收到一个数据报的全部数据报片时,就把已收到的数据报片都丢弃,并向源点发送时间超过报文。(TTL=0)
- 参数问题:当路由器或目的主机收到的数据报的首部中有的字段的值不正确时,就丢弃该数据报,并向源点发
送参数问题报文。(首部字段有问题) - 改变路由(重定向):路由器把改变路由报文发送给主机,让主机知道下次应将数据报发送给另外的路由器(可通过更好的路由)。
ICMP差错报告报文数据字段
不应发送ICMP差错报文的情况
- 对ICMP差错报告报文不再发送ICMP差错报告报文。
- 对第一个分片的数据报片的所有后续数据报片都不发送ICMP差错报告报文。
- 对具有组播地址(一点到多点)的数据报都不发送ICMP差错报告报文。
- 对具有特殊地址(如127.0.0.0或0.0.0.0)的数据报不发送ICMP差错报告报文。
ICMP询问报文
- .回送请求和回答报文:主机或路由器向特定目的主机发出的询问,收到此报文的主机必须给源主机或路由器发送ICMP回送回答报文。测试目的站是否可达以及了解其相关状态。
- 时间戳请求和回答报文:请某个主机或路由器回答当前的日期和时间。用来进行时钟同步和测量时间。
- 掩码地址请求和回答报文
- 路由器询问和通告报文
ICMP的应用
- PING:测试两个主机之间的连通性,使用了ICMP回送请求和回答报文。
- Traceroute:跟踪一个分组从源点到终点的路径,使用了ICMP时间超过差错报告报文。
2.7 IPV6
背景
从根本上解决地址耗尽问题,缓解方法是超网聚合、NAT等
IPv6数据报格式
版本 | 指明了协议版本,总是6。 |
---|---|
优先级 | 区分数据报的类别和优先级。 |
流标签 | “流”是互联网络上从特定源点到特定终点的一系列数 据报。所有属于同一个流的数据报都具有同样的流标签。 |
下一个首部 | 标识下一个扩展首部或上层协议首部。 |
跳数限制 | 相当于IPv4的TTL。 |
- IPv6将地址从32位(4B)扩大到128位(16B),更大的地址空间。
- IPv6将IPv4的校验和字段彻底移除,以减少每跳的处理时间。
- IPv6将IPv4的可选字段移出首部,变成了扩展首部,成为灵活的首部格式,路由器通常不对扩展首部进行检查, 大大提高了路由器的处理效率。
- IPv6支持即插即用(即自动配置),不需要DHCP协议。
- IPv6首部长度必须是8B的整数倍,IPv4首部是4B的整数倍。
- IPv6只能在主机处分片,IPv4可以在路由器和主机处分片。
- ICMPv6:附加报文类型“分组过大”。
- IPv6支持资源的预分配, 支持实时视像等要求,保证一定的带宽和时延的应用。
- IPv6取消了协议字段,改成下一个首部字段。
- IPv6取消了总长度字段,改用有效载荷长度字段。
- IPv6取消了服务类型字段。
IPv6地址表示形式
IPv6基本地址类型
- 单播:一对一通信。可做源地址+目的地址
- 多播:一对多通信。可做目的地址
- 任播:一对多中的一个通信。可做目的地址
IPv4向IPv6过渡的策略
- 双栈协议:双协议栈技术就是指在一台设备上同时启用IPv4协议栈和IPv6协议栈。这样的话,这台设备既能和IPv4网络通信,又能和IPv6网络通信。如果这台设备是一个路由器,那么这台路由器的不同接口上,分别配置了IPv4地址和IPv6地址,并很可能分别连接了IPv4网络和IPv6
网络。如果这台设备是一个计算机 - 隧道技术:将整个IPv6数据报封装到IPv4数据报的数据部分,使得IPv6数据报可以在IPv4网络的隧道中进行传输。
2.8 路由算法及路由协议
2.8.1 路由算法的分类
静态路由算法(非自适应路由算法):管理员手工配置路由信息。
简便、可靠,在负荷稳定、拓扑变化不大的网络中运行效果很 好,广泛用于高度安全性的军事网络和较小的商业网络。
路由更新慢,不适用大型网络。
动态路由算法:(自适应路由算法):路由器间彼此交换信息,按照路由算法优化出路由表项。路由更新快,适用大型网络,及时响应链路费用或网络拓扑变化。 算法复杂,增加网络负担。
2.8.2 分层次的路由选择协议
自治系统AS:在单一的技术管理下的一组路由器,而这些路由器使用一种AS内部的路由选择协议和共同的度量以确定分组在该AS内的路由,同时还使用一种AS之间的路由协议以确定在AS之间的路由。
一个AS内的所有网络都属于一个行政单位来管辖,一个自治系统的所有路由器在本自治系统内都必须连通。
2.9 RIP协议及距离向量算法
2.9.1 路由信息协议(RIP)
RIP是一种分布式的基于距离向量的路由选择协议,是因特网的协议标准,最大优点是简单。
RIP协议要求网络中每一个路由器都维护从它自己到其他每一个目的网络的唯一最佳距离记录(即一组距离)。
距离:通常为“跳数”,即从源端口到目的端口所经过的路由器个数,经过一个路由器跳数+1。特别的,从一路
由器到直接连接的网络距离为1。RIP允许一条路由最多只能包含15个路由器(RIP协议只适用于小互联网。),因此距离为16表示网络不可达。
- 仅和相邻路由器交换信息。
- 路由器交换的信息是自己的路由表
- .每30秒交换一次路由信息,然后路由器根据新信息更新路由表。若超过180s没收到邻居路由器的通告,则判定邻居没了,并更新自己路由表。
- 路由器刚开始工作时,只知道直接连接的网络的距离(距离为1),接着每一个路由器也只和数目非常有限的相邻路由器交换并更新路由信息。经过若干次更新后,所有路由器最终都会知道到达本自治系统任何一个网络的最短距离和下一跳路由器的地址,即“收敛
2.9.2 距离向量算法
- 修改相邻路由器发来的RIP报文中所有表项。对地址为X的相邻路由器发来的RIP报文,修改此报文中的所有项目:把“下一跳”字段中的地址改为X,并把所有的“距离”字段+1。
- 对修改后的RIP报文中的每一个项目,进行以下步骤: (1)R1路由表中若没有Net3,则把该项目填入R1路由表
(2)R1路由表中若有Net3,则查看下一跳路由器地址:
若下一跳是X,则用收到的项目替换源路由表中的项目; 若下一跳不是X, 原来距离比从X走的距离远则更新,否则不作处理。 - 若180s还没收到相邻路由器X的更新路由表,则把X记为不可达的路由器,即把距离设置为16。
- 返回
RIP协议的报文格式
RIP协议好消息传得快,坏消息传得慢。
RIP的特点:当网络出现故障时,要经过比较长的时间 (例如数分钟) 才能将此信息传送到所有的路由器,“慢收敛”
2.10 OSPF协议及链路状态算法
2.10.1 OSPF协议
开放最短路径优先OSPF协议:“开放”标明OSPF协议不是受某一家厂商控制,而是公开发表的;“最短路径优先”是因为使用了Dijkstra提出的最短路径算法SPF。
OSPF最主要的特征就是使用分布式的链路状态协议。
2.10.2 链路状态路由算法
- 每个路由器发现它的邻居结点【HELLO问候分组】,并了解邻居节点的网络地址。
- 设置到它的每个邻居的成本度量metric。
- 构造【DD数据库描述分组】,向邻站给出自己的链路状态数据库中的所有链路状态项目的摘要信息。
- 如果DD分组中的摘要自己都有,则邻站不做处理;如果有没有的或者是更新的,则发送【LSR链路状态请求分组】请求自己没有的和比自己更新的信息。
- .收到邻站的LSR分组后,发送【LSU链路状态更新分组】进行更新。
- 更新完毕后,邻站返回一个【LSAck链路状态确认分组】进行确认。
只要一个路由器的链路状态发生变化: - 泛洪发送【LSU链路状态更新分组】进行更新。
- 更新完毕后,其他站返回一个【LSAck链路状态确认分组】进行确认。
- 使用Dijkstra根据自己的链路状态数据库构造到其他节点间的最短路径。
OSPF的区域
为了使 OSPF 能够用于规模很大的网络,OSPF 将一个自治系统再划分为若干个更小的范围,叫做区域。
每一个区域都有一个 32 位的区域标识符(用点分十进制表示)。
区域也不能太大,在一个区域内的路由器最好不超过 200 个。
OSPF分组
OSPF其他特点
- 每隔30min,要刷新一次数据库中的链路状态。
- 由于一个路由器的链路状态只涉及到与相邻路由器的连通状态,因而与整个互联网的规模并无直接关系。因此当互联网规模很大时,OSPF协议要比距离向量协议 RIP好得多。
- OSPF不存在坏消息传的慢的问题,它的收敛速度很快。
2.11 BGP(边界网关协议)
BGP交换信息的过程
BGP所交换的网络可达性的信息就是要到达某个网络所要经过的一系列 AS。当 BGP 发言人互相交换了网络可达性的信息后,各 BGP发言人就根据所采用的策略从收到的路由信息中找出到达各 AS的较好路由。
BGP协议报文格式
一个 BGP 发言人与其他自治系统中的 BGP 发言人要交换路由信息,就要先建立 TCP连接,即通过TCP传送,然后在此连接上交换 BGP 报文以建立 BGP 会话(session),利用 BGP会话交换路由信息。
BGP协议特点
- BGP支持 CIDR,因此 BGP 的路由表也就应当包括目的网络前缀、下一跳路由器,以及到达该目的网络所要经过的各个自治系统序列。
- 在BGP 刚刚运行时,BGP 的邻站是交换整个的 BGP 路由表。但以后只需要在发生变化时更新有变化的部分。这样做对节省网络带宽和减少路由器的处理开销都有好处
BGP-4的四种报文
- OPEN(打开)报文:用来与相邻的另一个BGP发言人建立关系,并认证发送方。
- UPDATE(更新)报文:通告新路径或撤销原路径。
- KEEPALIVE(保活)报文:在无UPDATE时,周期性证实邻站的连通性;也作为OPEN的确认。
- NOTIFICATION(通知)报文:报告先前报文的差错;也被用于关闭连接。
三种路由协议比较
2.12 IP组播
IP数据报的三种传播方式
- 单播:单播用于发送数据包到单个目的地,且每发送一份单播报文都使用一个单播IP地址作为目的地址。是一种点对点传输方式。
- 广播:广播是指发送数据包到同一广播域或子网内的所有设备的一种数据传输方式,是一种点对多点传输方式。
- 组播(多播):当网络中的某些用户需要特定数据时,组播数据发送者仅发送一次数据,借助组播路由协议为组播数据包建立组播分 发树,被传递的数据到达距离用户端尽可能近的节点后才开始复制和分发,是一种点对多点传输方式。
IP组播地址
IP组播地址让源设备能够将分组发送给一组设备。属于多播组的设备将被分配一个组播组IP地址(一群共同需求主机的相同标识)。
组播地址范围为224.0.0.0~239.255.255.255(D类地址),一个D类地址表示一个组播组。只能用作分组的目标地址。源地址总是为单播地址
- 组播数据报也是“尽最大努力交付”,不提供可靠交付,应用于UDP。
- 对组播数据报不产生ICMP差错报文。
- 并非所有D类地址都可以作为组播地址。
硬件组播
同单播地址一样,组播IP地址也需要相应的组播MAC地址在本地网络中实际传送帧。组播MAC地址以十六进制 值01-00-5E打头,余下的6个十六进制位是根据IP组播组地址的最后23位转换得到的。
TCP/IP 协议使用的以太网多播地址的范围是:从01-00-5E-00-00-00到01-00-5E-7F-FF-FF.
收到多播数据报的主机,还要在IP层利用软件进行过滤,把不是
本主机要接收的数据报丢弃。
IGMP协议与组播路由选择协议
IGMP协议让路由器知道本局 域网上是否有主机(的进程)参加或退出了某个组播组。
ICMP和IGMP都使用IP数据报传递报文。
IGMP工作的两个阶段
- 某主机要加入组播组时,该主机向组播组的组播地址发送一个IGMP报文,声明自己要称为该组的成员。本地组播路由器收到IGMP报文后,要利用组播路由选择协议把这组成员关系发给因特网上的其他组播路由器。
- 本地组播路由器周期性探询本地局域网上的主机,以便知道这些主机是否还是组播组的成员。
只要有一个主机对某个组响应,那么组播路由器就认为这个组是活跃的;如果经过几次探询后没有一个主机响应,组播路由器就认为本网络上的没有此组播组的主机,因此就不再把这组的成员关系发给其他的组播路由器。
组播路由器知道的成员关系只是所连接的局域网中有无组播组的成员
组播路由选择协议
组播路由协议目的是找出以源主机为根节点的组播转发树。
构造树可以避免在路由器之间兜圈子。
对不同的多播组对应于不同的多播转发树;同一个多播组,对不同的源点也会有不同的多播转发树。
组播路由选择协议常使用的三种算法:
- 基于链路状态的路由选择
- 基于距离-向量的路由选择
- 协议无关的组播
2.13 移动IP
移动IP相关概念
移动IP技术是移动结点(计算机/服务器等)以固定的网络IP地址,实现跨越不同网段的漫游功能,并保证了 基于网络IP的网络权限在漫游过程中不发生任何改变。
- 移动结点:具有永久IP地址的移动设备。
- 归属代理(本地代理):一个移动结点的永久“居所”称为归属网络,在归属网络中代表移动节点执行移 动管理功能的实体叫做归属代理。
- 永久地址(归属地址/主地址):移动站点在归属网络中的原始地址。
- 外部代理(外地代理):在外部网络中帮助移动节点完成移动管理功能的实体称为外部代理
- 转交地址(辅地址):可以是外部代理的地址或动态配置的一个地址。
移动IP通信过程
2.14 网络层设备
路由器:路由器是一种具有多个输入端口和多个输出端口的专用计算机,其任务是转发分组。
三层设备的区别