1、I/O
模型
阻塞式
I/O:是最简单、最经常使用的模型也是Linux默认使用的模型。在此模型下针对所有套接字的操作都是阻塞的,套接字阻塞时主动放弃CPU。该方式的主要缺点是效率不高,进程有可能永远阻塞。
非阻塞
I/O:在一个非阻塞式套接字上进行输入输出操作时,如果操作不能完成,函数立即以错误返回,而不是一直等待。非阻塞式套接字的缺点是编程比较复杂,操作将占用大量CPU处理时间,程序员需要自己检查操作完成与否。
信号驱动
I/O:利用了内核的信号机制。当套接字描述符可以进行读写操作时,内核用信号SIGIO通知进程。该方式的主要缺点是:信号处理函数的编写增加了编程的难度;面向字符流的下CP连接不适合使用信号驱动模型,因为每个字符的到达或发送都可能引发SIGIO信号,而且程序很难以区分读、写两种信号。
一个包含阻塞式套接字函数的进程被启动后,它将处于可运行状态,在成为当前进程时,如果调用了connect()、read()、write()等函数,进程需要等待足够的缓存区或通信对方的响应,这些要求常常不能立刻得到满足,于是进程转换到等待状态,产生阻塞。这种阻塞一直持续到函数需求得到满足、得到通信对方的响应、被信号中断或发生系统故障。
socket函数中能够产生阻塞的有四类:
(1) 数据发送:包括sendmsg()、sendto()、send()、write()和writev()。
(2) 数据接收:包括revvmsg()、recvfrom()、recv()、read()和readv()。
(3) 建立连接:connect()。
(4) 接受连接:accept()。
套接字函数与内核函数名称的对应关系
套接字内核中主要数据收/发函数之间的调用关系
用户程序被阻塞的四种操作过程:
(1) 数据发送:如图7-3所示,应用程序调用数据发送函数后,进程进入内核态运行,内核程序先做一系列初始化工作,包括合法性检查、将通信对方的地址结构从用户空间向内核空间拷贝等,若在此过程中出现错误,则退出内核状态,切换到用户态运行,并返回错误代码;若初始化工作未出现错误,则内核运行sock_sendmsg()函数,阻塞进程直到将待发送的数据从用户空间拷贝到套接字的发送缓存区,然后进程切换回用户态,继续应用程序的运行。
(2) 数据接收:如图7-4所示,应用程序调用数据接收函数后,进程进入内核态运行,内核程序先做一系列初始化工作,包括合法性检查、将通信对方的地址结构从用户空间向内核空间拷贝等,若在此过程中出现错误,则退出内核状态,切换到用户态运行,并返回错误代码;若初始化工作未出现错误,则内核运行sock_recvmsg()函数,阻塞进程直到有数据包到达,然后接收到的数据被从套接字的接收缓存区拷贝到用户空间,接下来进程切换回用户态,继续应用程序的运行。
(3) 建立连接:如图7-5所示,应用程序调用数据连接函数后,进程进入内核态运行,内核程序先做一系列初始化工作,包括合法性检查、将通信对方的地址结构从用户空间向内核空间拷贝等,若在此过程中出现错误,则退出内核状态,切换到用户态运行,并返回错误代码;若初始化工作未出现错误,则内核运行sock->ops->connect()函数,阻塞进程直到三次握手操作结束,然后进程切换回用户态,继续应用程序的运行。
(4) 接受连接:如图7-6所示,应用程序调用接受连接函数后,进程进入内核态运行,内核程序先做一系列初始化工作,包括合法性检查、将通信对方的地址结构从用户空间向内核空间拷贝等,若在此过程中出现错误,则退出内核状态,切换到用户态运行,并返回错误代码;若初始化工作未出现错误,则内核运行sock->ops->accept()函数,阻塞进程直到有效的客户连接请求被接受,然后建立一个连接套接字,并将进程切换回用户态,继续应用程序的运行。
非阻塞函数的编程
采用两种方法可以将套接字设为非阻塞式:
(1) 函数fcntl(),设置O_NONBLOCK选项:
int flag=fcntl(sockfd,F_GETFL,0);
fcntl(sockfd,F_SETFL,flag|O_NONBLOCK);
(2) 函数ioctl(),设置FIONBIO选项:
int nIO=1;
ioctl(sockfd,FIONBIO,&nIO);
非阻塞式I/O模型可以避免进程被长期阻塞的问题,使得进程在没有套接字描述符就绪的时候可以进行其他的工作,能够提高系统的工作效率,但是编程相对于阻塞式I/O要复杂一些,逻辑结构不如阻塞式I/O清晰。另外,非阻塞式程序需要不断地检查是否有套接字描述符就绪,持续占用CPU的时间,因此也常常需要采用定时查询等方法加以改进。
基本的非阻塞式程序有三种:一般、定时查询和多连接。
第7章_阻塞式非阻塞式.ppt