Linux网络编程常见I/O模型总结

于 2015-01-14 23:35:20 发布

阅读量617

点赞数

分类专栏： Linux

本文链接：https://blog.csdn.net/view1221/article/details/42721097

版权

Linux 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

【摘要】

Liunx网络编程中，经常会需要根据业务的不同，和性能要求的不同，来选择I/O处理方式，本文介绍几种常见的五种I/O模型，并重点讲解最常见最实用的I/O多路复用模型。

【关键词】

Linux，网络编程，I/O模型

【类别】

Linux编程类

一五种I/O模型

下面我们简单的介绍一个各种I/O 操作模式。在Linux/UNIX 下，有下面这五种I/O 操作方式：

阻塞I/O
非阻塞I/O
I/O 多路复用
信号驱动I/O（SIGIO）
异步I/O

一般来说，程序进行输入操作有两步：

等待有数据可以读
将数据从系统内核中拷贝到程序的数据区。

对于一个对套接字的输入操作，第一步一般来说是等待数据从网络上传到本地。当数

据包到达的时候，数据将会从网络层拷贝到内核的缓存中；第二步是从内核中把数据拷贝到程序的数据区中。

1.1 阻塞IO模式

阻塞I/O 模式是最普遍使用的I/O 模式。大部分程序使用的都是阻塞模式的I/O 。缺

省的，一个套接字建立后所处于的模式就是阻塞I/O 模式。

对于一个UDP 套接字来说，数据就绪的标志比较简单：

已经收到了一整个数据报
没有收到。

一个进程调用recvfrom ，然后系统调用并不返回知道有数据报到达本地系统，然后系统将数据拷贝到进程的缓存中。

我们称这个进程在调用recvfrom 一直到从recvfrom 返回这段时间是阻塞的。当recvfrom

正常返回时，我们的进程继续它的操作。

图1-1 阻塞模式

1.2 非阻塞I/O模型

将socket变为非阻塞方法：

int flags = fcntl(sockfd, F_GETFL, 0);

fcntl(sockfd, F_SETFL, flags | O_NONBLOCK);

当我们将一个套接字设置为非阻塞模式，我们相当于告诉了系统内核：“当我请求的

I/O 操作不能够马上完成，你想让我的进程进行休眠等待的时候，不要这么做，请马上返

回一个错误给我。”

我们可以参照图1-2 来描述非阻塞模式I/O 。

我们开始对recvfrom 的三次调用，因为系统还没有接收到网络数据，所以内核马上返

回一个EWOULDBLOCK的错误。第四次我们调用recvfrom 函数，一个数据报已经到达了，

内核将它拷贝到我们的应用程序的缓冲区中，然后recvfrom 正常返回，我们就可以对接收

到的数据进行处理了。

当一个应用程序使用了非阻塞模式的套接字，它需要使用一个循环来不听的测试是否一个文件描述符有数据可读（称做polling）。应用程序不停的polling 内核来检查是否I/O操作已经就绪。这将是一个极浪费CPU 资源的操作。这种模式使用中不是很普遍。

图1-2 非阻塞模式

1.3 I/O多路复用

在使用I/O 多路技术的时候，我们调用select()函数和poll()函数，在调用它们的时候阻塞，而不是我们来调用recvfrom（或recv）的时候阻塞。图1-3说明了它的工作方式。当我们调用select 函数阻塞的时候，select 函数等待数据报套接字进入读就绪状态。当select 函数返回的时候，也就是套接字可以读取数据的时候。这时候我们就可以调用recvfrom函数来将数据拷贝到我们的程序缓冲区中。

和阻塞模式相比较，select()和poll()并没有什么高级的地方，而且，在阻塞模式下只需要调用一个函数：读取或发送，在使用了多路复用技术后，我们需要调用两个函数了：先调用select()函数或poll()函数，然后才能进行真正的读写。

多路复用的高级之处在于，它能同时等待多个文件描述符，而这些文件描述符（套接字描述符）其中的任意一个进入读就绪状态，select()函数就可以返回。

图1-3 I/O多路复用

多路复用的方式是真正实用的服务器程序，非多路复用的网络程序只能作为学习或着陪测的角色。下面介绍一下多路复用函数：select/poll/epoll/port。select-->poll-->epoll/port的演化路线：

一、select模型
select原型：

int select(int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

其中参数n表示监控的所有fd中最大值＋1。和select模型紧密结合的四个宏，：

FD_CLR(int fd, fd_set *set);
  FD_ISSET(int fd, fd_set *set);
  FD_SET(int fd, fd_set *set);
  FD_ZERO(fd_set *set);

理解select模型的关键在于理解fd_set,为说明方便，取fd_set长度为1字节，fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。
（1）执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。
（2）若fd＝5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)
（3）若再加入fd＝2，fd=1,则set变为0001,0011
（4）执行select(6,&set,0,0,0)阻塞等待
（5）若fd=1,fd=2上都发生可读事件，则select返回，此时set变为0000,0011。注意：没有事件发生的fd=5被清空。

基于上面的讨论，可以得出select模型的特点：
（1) 可监控的文件描述符个数取决与sizeof(fd_set)的值。由于fd_set类型的长度在不同平台上不同。
（2）将fd加入select监控集的同时，还要再使用一个数据结构array保存放到select监控集中的fd，一是用于再select返回后，array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空，则每次开始select前都要重新从array取得fd逐一加入（FD_ZERO最先），扫描array的同时取得fd最大值maxfd，用于select的第一个参数。
（3）可见select模型必须在select前循环array（加fd，取maxfd），select返回后循环array（FD_ISSET判断是否有事件发生）。

下面给一个伪码说明基本select模型的服务器模型：

· array[slect_len];
nSock=0;
array[nSock++]=listen_fd;(之前listen port已绑定并listen)
maxfd=listen_fd;
while{

· FD_ZERO(&set);

· foreach (fd in array)

· {

· fd大于maxfd，则maxfd=fd

· FD_SET(fd,&set)

· }

· res=select(maxfd+1,&set,0,0,0)；

· //检测是否是一个新连接过来

· if(FD_ISSET(listen_fd,&set))

· {

· newfd=accept(listen_fd);

· array[nsock++]=newfd;
if(--res<=0) continue

· }

· foreach 下标1开始 (fd in array)

· {

· if(FD_ISSET(fd,&set))

· 执行读等相关操作

· 如果错误或者关闭，则要删除该fd，将array中相应位置和最后一个元素互换就好，nsock减一
if(--res<=0) continue

· }

二、poll模型
poll原型:

· int poll(struct pollfd *ufds, unsigned int nfds, int timeout);
struct pollfd {

· int fd; /* file descriptor */
short events; /* requested events */

· short revents; /* returned events */

· };

和select相比，两大改进：
（1）不再有fd个数的上限限制，可以将参数ufds想象成栈低指针，nfds是栈中元素个数，该栈可以无限制增长
（2）引入pollfd结构，将fd信息、需要监控的事件、返回的事件分开保存，则poll返回后不会丢失fd信息和需要监控的事件信息，也就省略了select模型中前面的循环操作，返回后的循环仍然不可避免。另每次poll阻塞操作都会自动把上次的revents清空。

（3）另外，poll() 函数不会受到socket描述符上的O_NDELAY标记和O_NONBLOCK标记的影响和制约，也就是说，不管socket是阻塞的还是非阻塞的，poll()函数都不会收到影响；而select()函数则不同，select()函数会受到O_NDELAY标记和O_NONBLOCK标记的影响，如果socket是阻塞的socket，则调用select()跟不调用select()时的效果是一样的，socket仍然是阻塞式TCP通讯，相反，如果socket是非阻塞的socket，那么调用select()时就可以实现非阻塞式TCP通讯。
poll的服务器模型伪码：

· struct pollfd fds[POLL_LEN];
unsigned int nfds=0;
fds[0].fd=server_sockfd;
fds[0].events=POLLIN|POLLPRI;
nfds++;

while{

· res=poll(fds,nfds,-1);

· if(fds[0].revents&(POLLIN|POLLPRI))

· {

· 执行accept并加入fds中,if(--res<=0)continue

· }

· 循环之后的fds，

· if(fds[i].revents&(POLLIN|POLLERR ))

· {操作略if(--res<=0)continue}
}

注意select和poll中res的检测，可有效减少循环的次数，这也是大量死连接存在时，select和poll性能下降厉害的原因。

1.4信号驱动I/O模式

我们可以使用信号，让内核在文件描述符就绪的时候使用SIGIO 信号来通知我们。我

们将这种模式称为信号驱动I/O 模式。

使用这种模式，我们首先需要允许套接字使用信号驱动I/O ，还要安装一个SIGIO 的

回调处理函数。在这种模式下，系统调用将会立即返回，然后我们的程序可以继续做其他的事情。当数据就绪的时候，系统会向我们的进程发送一个SIGIO 信号。这样我们就可以在SIGIO信号的处理函数中进行I/O 操作（或是我们在函数中通知主函数有数据可读）。

对于信号驱动I/O 模式，它的先进之处在于它在等待数据的时候不会阻塞，程序可以做自己的事情。当有数据到达的时候，系统内核会向程序发送一个SIGIO 信号进行通知，这样我们的程序就可以获得更大的灵活性，因为我们不必为等待数据进行额外的编码。

图1-4 信号驱动I/O模式

信号I/O 可以使内核在某个文件描述符发生改变的时候发信号通知我们的程序。异步

I/O 可以提高我们程序进行I/O 读写的效率。通过使用它，当我们的程序进行I/O 操作的时候，内核可以在初始化I/O 操作后立即返回，在进行I/O 操作的同时，我们的程序可以做自己的事情，直到I/O 操作结束，系统内核给我们的程序发消息通知。

基于Berkeley 接口的Socket 信号驱动I/O 使用信号SIGIO。有的系统SIGPOLL 信号，它也是相当于SIGIO 的。

为了在一个套接字上使用信号驱动I/O 操作，下面这三步是所必须的。

（1）一个和SIGIO 信号的处理函数必须设定。

（2）套接字的拥有者必须被设定。一般来说是使用fcntl 函数的F_SETOWN 参数来

进行设定拥有者。

（3）套接字必须被允许使用异步I/O。一般是通过调用fcntl 函数的F_SETFL 命令，

O_ASYNC 为参数来实现。

虽然设定套接字为异步I/O 非常简单，但是使用起来困难的部分是怎样在程序中断定

产生SIGIO 信号发送给套接字属主的时候，程序处在什么状态。

1．UDP 套接字的SIGIO 信号

在UDP 协议上使用异步I/O 非常简单．这个信号将会在这个时候产生：

l 套接字收到了一个数据报的数据包。

l 套接字发生了异步错误。

当我们在使用UDP 套接字异步I/O 的时候，我们使用recvfrom()函数来读取数据报数据或是异步I/O 错误信息。

2．TCP 套接字的SIGIO 信号

不幸的是，异步I/O 几乎对TCP 套接字而言没有什么作用。因为对于一个TCP 套接

字来说， SIGIO 信号发生的几率太高了，所以SIGIO 信号并不能告诉我们究竟发生了什

么事情。在TCP 连接中， SIGIO 信号将会在这个时候产生：

l 在一个监听某个端口的套接字上成功的建立了一个新连接。

l 一个断线的请求被成功的初始化。

l 一个断线的请求成功的结束。

l 套接字的某一个通道（发送通道或是接收通道）被关闭。

l 套接字接收到新数据。

l 套接字将数据发送出去。

l 发生了一个异步I/O 的错误。

1.5异步I/O模式

当我们运行在异步I/O 模式下时，我们如果想进行I/O 操作，只需要告诉内核我们要进行I/O 操作，然后内核会马上返回。具体的I/O 和数据的拷贝全部由内核来完成，我们的程序可以继续向下执行。当内核完成所有的I/O 操作和数据拷贝后，内核将通知我们的程序。

异步I/O 和信号驱动I/O 的区别是：

l 信号驱动I/O 模式下，内核在操作可以被操作的时候通知给我们的应用程序发送

SIGIO 消息。

l 异步I/O 模式下，内核在所有的操作都已经被内核操作结束之后才会通知我们的

应用程序。

如下图，当我们进行一个IO 操作的时候，我们传递给内核我们的文件描述符，我们

的缓存区指针和缓存区的大小，一个偏移量offset，以及在内核结束所有操作后和我们联

系的方法。这种调用也是立即返回的，我们的程序不需要阻塞住来等待数据的就绪。我们可以要求系统内核在所有的操作结束后（包括从网络上读取信息，然后拷贝到我们提供给内核的缓存区中）给我们发一个消息。

图1-5 异步I/O模式

二、实践情况

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录