本文从IPV4协议栈原始套接字的分类入手,详细介绍了链路层和网络层原始套接字的特点及其内核实现细节。并
本文从IPV4协议栈原始套接字的分类入手,详细介绍了链路层和网络层原始套接字的特点及其内核实现细节。并结合原始套接字的实际应用,说明各类型原始套接字的适应范围,以及在实际使用时需要注意的问题。
一、原始套接字概述
链路层原始套接字可以直接用于接收和发送链路层的MAC帧,在发送时需要由调用者自行构造和封装MAC首部。而网络层原始套接字可以直接用于接收和发送IP层的报文数据,在发送时需要自行构造IP报文头(取决是否设置IP_HDRINCL选项)。
1.1 链路层原始套接字
链路层原始套接字调用socket()函数创建。第一个参数指定协议族类型为,第二个参数type可以设置为SOCK_RAW或SOCK_DGRAM,第三个参数是协议类型(该参数只对报文接收有意义)。协议类型protocol不同取值的意义具体见表1所示:
a) 参数type设置为时,套接字接收和发送的数据都是从MAC首部开始的。在发送时需要由调用者从MAC首部开始构造和封装报文数据。type设置为SOCK_RAW的情况应用是比较多的,因为某些项目会使用到自定义的二层报文类型。
socket(PF_PACKET, SOCK_RAW, htons(protocol))
b) 参数type设置为时,套接字接收到的数据报文会将MAC首部去掉。同时在发送时也不需要再手动构造MAC首部,只需要从IP首部(或ARP首部,取决于封装的报文类型)开始构造即可,而MAC首部的填充由内核实现的。若对于MAC首部不关心的场景,可以使用这种类型,这种用法用得比较少。
socket(PF_PACKET, SOCK_DGRAM, htons(protocol))
表1 protocol不同取值
protocol |
值 |
作用 |
ETH_P_ALL |
0x0003 |
报收本机收到的所有二层报文 |
ETH_P_IP |
0x0800 |
报收本机收到的所有IP报文 |
ETH_P_ARP |
0x0806 |
报收本机收到的所有ARP报文 |
ETH_P_RARP |
0x8035 |
报收本机收到的所有RARP报文 |
自定义协议 |
比如0x0810 |
报收本机收到的所有类型为0x0810的二层报文 |
不指定 |
0 |
不能用于接收,只用于发送 |
…… |
…… |
…… |
表1中protocol的取值中有两个值是比较特殊的。当protocol为ETH_P_ALL时,表示能够接收本机收到的所有二层报文(包括IP, ARP, 自定义二层报文等),同时这种类型套接字还能够将外发的报文再收回来。当protocol为0时,表示该套接字不能用于接收报文,只能用于发送。2.2节中会详细介绍。
1.2 网络层原始套接字
创建面向连接的TCP和创建面向无连接的UDP套接字,在接收和发送时只能操作数据部分,而不能对IP首部或TCP和UDP首部进行操作。如果想要操作IP首部或传输层协议首部,就需要调用如下socket()函数创建网络层原始套接字。第一个参数指定协议族的类型为PF_INET,第二个参数为SOCK_RAW,第三个参数protocol为协议类型(不同取值的意义见表2)。产品线有使用OSPF和RSVP等协议,需要使用这种类型的套接字。
a) 接收报文
网络层原始套接字接收到的报文数据是从IP首部开始的,即接收到的数据包含了IP首部, TCP/UDP/ICMP等首部, 以及数据部分。
b) 发送报文
网络层原始套接字发送的报文数据,在默认情况下是从IP首部之后开始的,即需要由调用者自行构造和封装TCP/UDP等协议首部。
这种套接字也提供了发送时从IP首部开始构造数据的功能,通过setsockopt()给套接字设置上IP_HDRINCL选项,就需要在发送时自行构造IP首部。
int val = 1;
setsockopt (sockfd, IPPROTO_IP, IP_HDRINCL, &val, sizeof(val));
表2 protocol不同取
protocol |
值 |
作用 |
IPPROTO_TCP |
6 |
报收TCP类型的报文 |
IPPROTO_UDP |
17 |
报收UDP类型的报文 |
IPPROTO_ICMP |
1 |
报收ICMP类型的报文 |
IPPROTO_IGMP |
2 |
报收IGMP类型的报文 |
IPPROTO_RAW |
255 |
不能用于接收,只用于发送(需要构造IP首部) |
OSPF |
89 |
接收协议号为89的报文 |
…… |
…… |
…… |
表2中protocol取值为IPPROTO_RAW是比较特殊的,表示套接字不能用于接收,只能用于发送(且发送时需要从IP首部开始构造报文)。具体的实现细节在2.3节中会详细介绍。
二、原始套接字实现
本节主要首先介绍链路层和网络层原始套接字报文的收发总体流程,再分别对两类套接字的创建、接收、发送等具体实现细节进行介绍。
2.1 原始套接字报文收发流程
图1 原始套接字收发流程
如上图1所示为链路层和网络层原始套接字的收发总体流程。网卡驱动收到报文后在软中断上下文中由netif_receive_skb()处理,匹配是否有注册的链路层原始套接字,若匹配上就通过skb_clone()来克隆报文,并将报文交给相应的原始套接字。对于IP报文,在协议栈的ip_local_deliver_finish()函数中会匹配是否有注册的网络层原始套接字,若匹配上就通过skb_clone()克隆报文并交给相应的原始套接字来处理。
注意:这里只是将报文克隆一份交给原始套接字,而该报文还是会继续走后续的协议栈处理流程。
链路层原始套接字的发送,直接由套接字层调用packet_sendmsg()函数,最终再调用网卡驱动的发送函数。网络层原始套接字的发送实现要相对复杂一些,由套接字层调用inet_sendmsg()->raw_sendmsg(),再经过路由和邻居子系统的处理后,最终调用网卡驱动的发送函数。若注册了ETH_P_ALL类型套接字,还需要将外发报文再收回去。
2.2 链路层原始套接字的实现
2.2.1 套接字创建
函数创建套接字的流程如下,链路层原始套接字最终由pac