无连接、不可靠的协议
IP是网络层协议,它总是尽最大的努力将分组传输到目的终点。为了达到最大努力,IP放弃了差错检验和跟踪,分组在传输过程中可能会出现丢包或者损坏(一般在高层提供解决方案),故IP是“不可靠的”;IP将每个分组作为一个独立的报文发送出去,在分组交换网络中从同一起点出发的这些分组可能会通过不同的路由传输到达终点(路径的不同导致到达终点时候的分组也会出现乱序问题),所以IP是“无连接的”。
注:
或许会有疑问说IP报头不也提供了“检验和”来进行差错检验功能吗?怎么说“IP放弃了差错检验”?
其实,前面说的“IP放弃了差错检验”是针对整个数据包来说的。要知道,IP分组的检验和只是作用在数据报首部,而对报文的数据部分并不做差错检验。以上做法是有更深层次的目的的:IP报文在网络中是通过路由节点逐跳传输的,每次经过一个路由设备就会修改报文的IP头部而数据部分保持不变,因为IP头部修改频繁故对该部分提供差错检验,使得收到该报文的接收端可以判断是否接收(通过计算检验和是否正确)。若是IP检验和将报文的数据报文一起包含起来,则在每个路由节点都会对基本不变的数据部分进行一次处理,这将增加路由的时间开销,违背了IP“尽最大努力”的原则。所以对于分组报文数据部分的检验一般都是由IP之上的高层协议来提供。 不得不赞叹:)
数据报
在IP层的分组叫做数据报。
数据报的格式
其中:
1、版本:有版本4和版本6
2、首部长度:定义数据报的总长度,以4字节为单位计算。首部长度在 20~60字节之间。
3、服务类型:前三位为优先位,后面两位为TOS位,最后一位没有使用。
4、总长度:定义以字节计的数据报总长度(首部加上数据),故数据报长度限制为65535
5、标识:标志从源主机发出的数据报。该字段和Flags和Fragment Offest字段联合使用,对较大的上层数据包进行分段(fragment)操作。路由器 将一个包拆分后,所有拆分开的小包被标记相同的值,以便目的端设备能够区分哪个包属于被拆分开的包的一部分。
6、标志:该字段第一位不使用。第二位是DF(Don't Fragment)位,DF位设为1时表明路由器不能对该上层数据包分段。如果一个上层数据包无法在 不分段的情况下进行转发,则路由器会丢弃该上层数据包并返回一个错误信息。第三位是MF(More Fragments)位,当路由器对一个上层数 据包分段,则路由器会在除了最后一个分段的IP包的包头中将MF位设为1。
8、分片偏移:表示这个分片在整个数据报中的相对位置,偏移值以8字节为度量单位
9、生存时间:当IP包进行传送时,先会对该字段赋予某个特定的值。当IP包经过每一个沿途的路由器的时候,每个沿途的路由器会将IP包的TTL值减少1。如果TTL减少为0,则该IP包会被丢弃。
10、协议:定义使用IP层服务的高层协议。
11、检验和:用来做IP头部的正确性检测,但不包含数据部分。 因为每个路由器要改变TTL的值,所以路由器会为每个通过的数据包重新计算这个值
12、源地址:定义源点的IP地址
13:目的地址:定义终点的IP地址
14、选项:这是可变部分,对数据报来说不是必须的,主要用于网络的测试和排错。
定义IP分组头格式
linux 中对于 IP头部 的定义
include/linux/ip.h
/*区分服务:TOS位*/
#define IPTOS_TOS_MASK 0x1E
#define IPTOS_TOS(tos) ((tos)&IPTOS_TOS_MASK)
#define IPTOS_LOWDELAY 0x10 //最小延时
#define IPTOS_THROUGHPUT 0x08 //最大吞吐量
#define IPTOS_RELIABILITY 0x04 //最高可靠性
#define IPTOS_MINCOST 0x02 //最小代价
/*区分服务:优先位*/
#define IPTOS_PREC_MASK 0xE0
#define IPTOS_PREC(tos) ((tos)&IPTOS_PREC_MASK)
#define IPTOS_PREC_NETCONTROL 0xe0
#define IPTOS_PREC_INTERNETCONTROL 0xc0
#define IPTOS_PREC_CRITIC_ECP 0xa0
#define IPTOS_PREC_FLASHOVERRIDE 0x80
#define IPTOS_PREC_FLASH 0x60
#define IPTOS_PREC_IMMEDIATE 0x40
#define IPTOS_PREC_PRIORITY 0x20
#define IPTOS_PREC_ROUTINE 0x00
/* IP options */
#define IPOPT_COPY 0x80 //复制
#define IPOPT_CLASS_MASK 0x60 //类
#define IPOPT_NUMBER_MASK 0x1f //数
#define IPOPT_COPIED(o) ((o)&IPOPT_COPY)
#define IPOPT_CLASS(o) ((o)&IPOPT_CLASS_MASK)
#define IPOPT_NUMBER(o) ((o)&IPOPT_NUMBER_MASK)
/*类*/
#define IPOPT_CONTROL 0x00 //数据报控制
#define IPOPT_RESERVED1 0x20 //保留
#define IPOPT_MEASUREMENT 0x40 //排错和管理
#define IPOPT_RESERVED2 0x60 //保留
/*数*/
#define IPOPT_END (0 |IPOPT_CONTROL) //选项结束
#define IPOPT_NOOP (1 |IPOPT_CONTROL) //无操作
#define IPOPT_SEC (2 |IPOPT_CONTROL|IPOPT_COPY)
#define IPOPT_LSRR (3 |IPOPT_CONTROL|IPOPT_COPY) //不严格的源路由
#define IPOPT_TIMESTAMP (4 |IPOPT_MEASUREMENT) //时间戳
#define IPOPT_CIPSO (6 |IPOPT_CONTROL|IPOPT_COPY)
#define IPOPT_RR (7 |IPOPT_CONTROL) //记录路由
#define IPOPT_SID (8 |IPOPT_CONTROL|IPOPT_COPY)
#define IPOPT_SSRR (9 |IPOPT_CONTROL|IPOPT_COPY) //严格的源路由
#define IPOPT_RA (20|IPOPT_CONTROL|IPOPT_COPY)
#define IPVERSION 4
#define MAXTTL 255
#define IPDEFTTL 64
#define IPOPT_OPTVAL 0
#define IPOPT_OLEN 1
#define IPOPT_OFFSET 2
#define IPOPT_MINOFF 4
#define MAX_IPOPTLEN 40
#define IPOPT_NOP IPOPT_NOOP
#define IPOPT_EOL IPOPT_END
#define IPOPT_TS IPOPT_TIMESTAMP
#define IPOPT_TS_TSONLY 0 /* timestamps only */
#define IPOPT_TS_TSANDADDR 1 /* timestamps and addresses */
#define IPOPT_TS_PRESPEC 3 /* specified modules only */
#define IPV4_BEET_PHMAXLEN 8
struct iphdr {
#if defined(__LITTLE_ENDIAN_BITFIELD)
__u8 ihl:4,
version:4;
#elif defined (__BIG_ENDIAN_BITFIELD)
__u8 version:4,
ihl:4;
#else
#error "Please fix <asm/byteorder.h>"
#endif
__u8 tos;
__be16 tot_len;
__be16 id;
__be16 frag_off;
__u8 ttl;
__u8 protocol;
__sum16 check;
__be32 saddr;
__be32 daddr;
/*The options start here. */
};
选项
选项部分可以用于网络的测试和排错,但是对于每个数据报来说并不是必需的。简单介绍一下几个选项类型的作用:
无操作:用于选项之间的填充符。
选项结束:用于选项字段结束时的填充。
记录路由:记录分组网络中处理数据报的路由器,最多可记录9个路由器的IP。(ping程序中的 -R 选项)
严格的源路由:用于确定数据报在分组网络中的传输路径,不得经过未确定的路由器。(traceroute中的 -G 选项)
不严格的源路由:用于确定数据报在分组网络中的传输路径,可经过未确定的路由器。(traceroute中的 -g 选项)
时间戳:用于记录路由器处理数据报的时间。
分片和重组
物理网络有一个最大数据帧的限制,用MTU最大传输单元来表示,这是由网络使用的硬件特性所决定的。在分组交换网中,数据报可能会经过多个不同的网络,数据帧的传输必须适应各个网络的MTU限制,所以数据报在到达终点之前需要经过多次的分片。
分片是在源主机或者网络中经过的路由器上进行。数据分片后,每个分片都是新的独立的数据报,并拥有有自己的首部。
分片后的数据可通过不同的路径到达终点,最后在终点的目的主机上进行重组。
在IP报文首部,与分片重组有关的三个字段分别为:标识、标志和分片偏移。标识用于表示这些分片属于同一原始数据报,目的主机通过标识可以将分片重组成为一个数据报。标志用于分片控制和表示分片结束,字段第二位是不分片位,第三位是还有分片位。分片偏移用于确定该分片在整个原始数据报中的相对位置,以8字节为度量单位。
IP地址
分类编址
分类编制将地址空间分成了5类:
类别 | A | B | C | D | E |
二进制记法的区别(第一字节) | 0 | 10 | 110 | 1110 | 1111 |
点分十进制的区别(第一字节) | 0~127 | 128~191 | 192~223 | 224~239 | 240~255 |
地址数 | 2^31 | 2^30 | 2^29 | 2^28 | 2^28 |
其中,A、B、C类的IP地址分为网络标识和主机标识两个部分。网络标识用于标识该IP属于哪个机构的网络,主机标识用于标识该机构网络内唯一一台主机。D类和E类不进行划分,D类地址用来进行广播,E类地址是保留的。
类别 | A | B | C |
网络标识长度 | 一字节 | 两字节 | 三字节 |
主机标识长度 | 三字节 | 两字节 | 一字节 |
默认掩码 | 255.0.0.0 | 255.255.00.0 | 255.255.255.0 |
无分类编址
由于分类编址的设计,地址空间存在这些问题:A类中大型机构用不上那么多的地址数(2^24)、B类中中等规模的机构也用不上(2^16),然而C类小型机构确会出现地址数(2^8)不够用的情况。于是出现了另一种分类方式:无分类编址。无分类编址能够灵活有效地根据地址数需求来划分地址空间。
无分类编址存在着三个限制条件:地址数必须是2的乘方;掩码必须定义在地址中以界定这个地址块;地址块中的第一个地址必须能够被地址数整除。