套接字究竟是什么
如果你知道Linux系统中进程间通信的方式,就应该知道套接字也是其中一种。但套接字特别之处在于它不仅可以用来实现同一台主机上进程间的通信,还可以用来实现主机间的进程间的通信。通信的双方各自打开一个套接字,套接字之间通过通信链路相连。
如果把两个套接字之间的‘连接’比喻成‘水管’,那么套接字就是‘水龙头’
Unix有一句格言:everything is a file,即‘万物皆文件’,套接字也不例外。那么如何把套接字和文件联系起来呢? 答案就是通过下面这张图。
其中task_struct表示一个进程,files_struct中的fd_array[]表示该进程打开的所有描述符,对于套接字来说,与其他类型文件的区别就是最终f_op指向的是socket_file_ops。不过,可以看到,这里的socket_file_ops只有一些通用的操作,并没有send和recv。特有的操作通过 socketcall() 区分的。
socket 和 sock
终于到今天的主角了。实际上,对每一个新创建的套接字,内核协议栈都会创建struct socket和struct sock两个数据结构。这两个结构就像孪生兄弟,struct socket面向用户空间,struct sock面向内核空间。
struct socketstruct socket简化版的结构如下:
<net.h>
struct socket {
unsigned long flags;
const struct proto_ops *ops;
struct file *file;
struct sock *sk;
short type;
};
其中type表示协议,这是在创建套接字的时候的protocol参数确定的
int socket(int domain, int type, int protocol);
1
file指针指向上面那张图中的struct file结构,通过它,socket便与文件系统关联了起来。
sk指向孪生的兄弟sock结构。
socket结构中最重要的要数ops指针了,根据协议类型,它指向一种特定协议的实现。比如TCP的就是inet_stream_ops,ICMP、UDP协议对应inet_dgram_ops,RAWIP对应的是inet_sockraw_ops同样地,这些也都在创建套接字的时候就决定了。
struct proto_ops的简化版本的结构如下
<net.h>
struct proto_ops{
int family;
int (*bind)(struct socket *sock, struct sockaddr *myaddr, int sockaddr_len);
int (*connect)(struct socket *sock,struct sockaddr *vaddr,int sockaddr_len, int flags);
int (*accept)(struct socket *sock, struct socket *newsock, int flags);
int (*sendmsg)(struct socket *sock, struct msghdr *m, size_t total_len);
}
其中的接口名字是不是很熟悉?是的,它们和进行网络编程时调用的C库中函数名字是一样的。以sendmsg为例,真实的调用过程是这样
即当用户调用sendmsg时,内核会找到描述符fd对应的struct socket结构,然后调用sock->ops->sendmsg执行特定协议的发送。
那么,ops字段什么时候被赋值呢?答案是,在创建struct sock结构前。
struct sock_common {
struct proto *skc_prot;
};
struct sock {
struct sock_common __sk_common;
struct sk_buff_head sk_receive_queue;
struct sk_buff_head sk_write_queue;
};
其中最重要的字段就是skc_prot,它也是协议相关的。作为struct socket结构的孪生兄弟,struct sock结构也是在用户创建套接字时就创建的。
sock_alloc创建了struct socket结构,随后,根据用户传入的family,查询数组net_families,找到对应的函数指针,调用create.
net_families保存着内核启动时注册(通过sock_register)的 socket protocol handler,比如以下几种:
static const struct net_proto_family inet_family_ops = {
.family = PF_INET,
.create = inet_create,
.owner = THIS_MODULE,
};
static const struct net_proto_family netlink_family_ops = {
.family = PF_NETLINK,
.create = netlink_create,
.owner = THIS_MODULE, /* for consistency 8) */
};
static const struct net_proto_family packet_family_ops = {
.family = PF_PACKET,
.create = packet_create,
.owner = THIS_MODULE,
};
static const struct net_proto_family unix_family_ops = {
.family = PF_UNIX,
.create = unix_create,
.owner = THIS_MODULE,,
};
如果我们创建套接字时指定的family是PF_INET,那么此时我们就会调用inet_create
static int inet_create(struct net *net, struct socket *sock, int protocol,
int kern)
{
struct sock *sk;
struct inet_protosw *answer;
list_for_each_entry_rcu(answer, &inetsw[sock->type], list) {
err = 0;
/* Check the non-wild match. */
if (protocol == answer->protocol) {
if (protocol != IPPROTO_IP)
break;
} else {
/* Check for the two wild cases. */
if (IPPROTO_IP == protocol) {
protocol = answer->protocol;
break;
}
if (IPPROTO_IP == answer->protocol)
break;
}
err = -EPROTONOSUPPORT;
}
sock->ops = answer->ops;
sk = sk_alloc(net, PF_INET, GFP_KERNEL, answer_prot, kern);
if (sk->sk_prot->init) {
err = sk->sk_prot->init(sk);
}
}
首先是从inetsw数组搜索匹配对应的协议,inetsw称为协议开关表,内核启动时,通过inet_register_protosw进行注册。比如下面几项都会被注册
inetsw中注册的每种协议都有ops和prot两个字段,前者与struct socket结构关联到一起,后者与struct sock关联到一起。在inet_create中,struct socket的ops字段和struct sock的sk_prot字段被赋值。
以我们创建的套接字类型是TCP为例,此时struct socket和struct sock的关系如下:
还是继续刚才sendmsg的过程,由于struct socket的ops指向inet_stream_ops,所以实际调用的就是inet_sendmsg
https://blog.csdn.net/chenmo187J3X1/article/details/83902713