转自http://www.oschina.net/question/12_58913
IOCP(I/O Completion Port,I/O完成端口)是性能最好的一种I/O模型。它是应用程序使用线程池处理异步I/O请求的一种机制。在处理多个并发的异步I/O请求时,以往 的模型都是在接收请求是创建一个线程来应答请求。这样就有很多的线程并行地运行在系统中。而这些线程都是可运行的,Windows内核花费大量的时间在进 行线程的上下文切换,并没有多少时间花在线程运行上。再加上创建新线程的开销比较大,所以造成了效率的低下。
调用的步骤如下:
抽象出一个完成端口大概的处理流程:
1:创建一个完成端口。
2:创建一个线程A。
3:A线程循环调用GetQueuedCompletionStatus()函数来得到IO操作结果,这个函数是个阻塞函数。
4:主线程循环里调用accept等待客户端连接上来。
5:主线程里accept返回新连接建立以后,把这个新的套接字句柄用CreateIoCompletionPort关联到完成端口,然后发出一个异步的 WSASend或者WSARecv调用,因为是异步函数,WSASend/WSARecv会马上返回,实际的发送或者接收数据的操作由WINDOWS系统 去做。
6:主线程继续下一次循环,阻塞在accept这里等待客户端连接。
7:WINDOWS系统完成WSASend或者WSArecv的操作,把结果发到完成端口。
8:A线程里的GetQueuedCompletionStatus()马上返回,并从完成端口取得刚完成的WSASend/WSARecv的结果。
9:在A线程里对这些数据进行处理(如果处理过程很耗时,需要新开线程处理),然后接着发出WSASend/WSARecv,并继续下一次循环阻塞在GetQueuedCompletionStatus()这里。
归根到底概括完成端口模型一句话:
我们不停地发出异步的WSASend/WSARecv IO操作,具体的IO处理过程由WINDOWS系统完成,WINDOWS系统完成实际的IO处理后,把结果送到完成端口上(如果有多个IO都完成了,那么 就在完成端口那里排成一个队列)。我们在另外一个线程里从完成端口不断地取出IO操作结果,然后根据需要再发出WSASend/WSARecv IO操作。
而IOCP模型是事先开好了N个线程,存储在线程池中,让他们hold。然后将所有用户的请求都投递到一个完成端口上,然后N个工作线程逐一地从完成端口中取得用户消息并加以处理。这样就避免了为每个用户开一个线程。既减少了线程资源,又提高了线程的利用率。
完成端口模型是怎样实现的呢?我们先创建一个完成端口 (::CreateIoCompletioPort())。然后再创建一个或多个工作线程,并指定他们到这个完成端口上去读取数据。我们再将远程连接的套 接字句柄关联到这个完成端口(还是用::CreateIoCompletionPort())。一切就OK了。
工作线程都干些什么呢?首先是调 用::GetQueuedCompletionStatus()函数在关联到这个完成端口上的所有套接字上等待I/O的完成。再判断完成了什么类型的I /O。一般来说,有三种类型的I/O,OP_ACCEPT,OP_READ和OP_WIRTE。我们到数据缓冲区内读取数据后,再投递一个或是多个同类型 的I/O即可(::AcceptEx()、::WSARecv()、::WSASend())。对读取到的数据,我们可以按照自己的需要来进行相应的处 理。
为此,我们需要一个以OVERLAPPED(重叠I/O)结构为第一个字段的per-I/O数据自定义结构。
1 | typedef struct _PER_IO_DATA |
9 | } PER_IO_DATA, *PPER_IO_DATA; |
将一个PER_IO_DATA结构强制转化成一个 OVERLAPPED结构传给::GetQueuedCompletionStatus()函数,返回的这个PER_IO_DATA结构的的 nOperationType就是I/O操作的类型。当然,这些类型都是在投递I/O请求时自己设置的。
这样一个IOCP服务器的框架就出来了。当然,要做一个好的 IOCP服务器,还有考虑很多问题,如内存资源管理、接受连接的方法、恶意的客户连接、包的重排序等等。以上是个人对于IOCP模型的一些理解与看法,还 有待完善。另外各Winsock API的用法参见MSDN。
补充IOCP模型的实现:
02 | HANDLE FCompletPort = CreateIoCompletionPort( INVALID_HANDLE_VALUE, 0,0,0 ); |
05 | AConnect = accept( FListenSock, addr, len); |
06 | CreateIoCompletionPort( AConnect, FCompletPort, NULL, 0 ); |
11 | for ( int i=1;si.dwNumberOfProcessors*2+2;i++) |
13 | AThread = TRecvSendThread.Create( false ); |
14 | AThread.CompletPort = FCompletPort; |
OK,就这么简单,我们要做的就是建立一个IOCP,把远程连接的socket句柄绑定到刚才创建的IOCP上,最后创建n个线程,并告诉这n个线程到这个IOCP上去访问数据就可以了。
再看一下TRecvSendThread线程都干些什么:
01 | void TRecvSendThread.Execute(...) |
03 | while (!self.Terminated) |
06 | GetQueuedCompletionStatus( CompletPort, BytesTransd, CompletKey, POVERLAPPED(pPerIoDat), TIME_OUT ); |
08 | if (BytesTransd !=0) ....... |
12 | WSARecv( CompletKey, &(pPerIoDat->BufData), 1, BytesRecv, Flags, &(pPerIoDat->Overlap), NULL ); |
读写线程只是简单地检查IOCP是否完成了我们投递的读写操作,如果完成了则再投递一个新的读写请求。
应该注意到,我们创建的所有TRecvSendThread都在访问同一个IOCP(因为我们只创建了一个IOCP),并且我们没有使用临界区!难道不会产生冲突吗?不用考虑同步问题吗?
呵呵,这正是IOCP的奥妙所在。IOCP不是一个普通的对象,不需要考虑线程安全问题。它会自动调配访问它的线程:如果某个socket上有一个线程A正在访问,那么线程B的访问请求会被分配到另外一个socket。这一切都是由系统自动调配的,我们无需过问。
实例:
简单实现,适合IOCP入门
参考:《WINDOWS网络与通信程序设计》
019 | #ifndef _IOCPHEADER_H_20080916_ |
020 | #define _IOCPHEADER_H_20080916_ |
022 | #include <WINSOCK2.H> |
025 | #define BUFFER_SIZE 1024 |
030 | typedef struct _PER_HANDLE_DATA |
035 | }PER_HANDLE_DATA, *PPER_HANDLE_DATA; |
040 | typedef struct _PER_IO_DATA |
043 | char buf[BUFFER_SIZE]; |
050 | }PER_IO_DATA, *PPER_IO_DATA; |
074 | #include "IOCPHeader.h" |
077 | DWORD WINAPI ServerThread( LPVOID lpParam ); |
079 | int main( int argc, char *argv[] ) |
084 | if ( 0 != WSAStartup( MAKEWORD( 2, 2 ), &wsaData ) ) |
086 | printf ( "Using %s (Status:%s)\n" , wsaData.szDescription, wsaData.szSystemStatus ); |
087 | printf ( "with API versions: %d.%d to %d.%d" , |
088 | LOBYTE( wsaData.wVersion), HIBYTE( wsaData.wVersion ), |
089 | LOBYTE( wsaData.wHighVersion), HIBYTE( wsaData.wHighVersion) ); |
095 | printf ( "Windows sockets 2.2 startup\n" ); |
103 | HANDLE hIocp = ::CreateIoCompletionPort( INVALID_HANDLE_VALUE, 0, 0, 0 ); |
104 | ::CreateThread( NULL, 0, ServerThread, ( LPVOID )hIocp, 0, 0 ); |
107 | SOCKET sListen = ::socket( AF_INET,-SOCK_STREAM, 0 ); |
110 | addr.sin_family = AF_INET; |
111 | addr.sin_port = ::htons( nPort ); |
112 | addr.sin_addr.S_un.S_addr = INADDR_ANY; |
113 | ::bind( sListen, (sockaddr *)&addr, sizeof ( addr ) ); |
114 | ::listen( sListen, 5 ); |
116 | printf ( "iocp demo start......\n" ); |
122 | SOCKADDR_IN saRemote; |
123 | int nRemoteLen = sizeof ( saRemote ); |
124 | SOCKET sRemote = ::accept( sListen, (sockaddr *)&saRemote, &nRemoteLen ); |
127 | PPER_HANDLE_DATA pPerHandle = ( PPER_HANDLE_DATA )::GlobalAlloc( GPTR, sizeof ( PPER_HANDLE_DATA ) ); |
128 | if ( pPerHandle == NULL ) |
133 | pPerHandle->s = sRemote; |
134 | memcpy ( &pPerHandle->addr, &saRemote, nRemoteLen ); |
136 | ::CreateIoCompletionPort( ( HANDLE )pPerHandle->s, hIocp, ( DWORD )pPerHandle, 0 ); |
139 | PPER_IO_DATA pIoData = ( PPER_IO_DATA )::GlobalAlloc( GPTR, sizeof ( PPER_IO_DATA ) ); |
140 | if ( pIoData == NULL ) |
145 | pIoData->nOperationType = OP_READ; |
147 | buf.buf = pIoData->buf; |
148 | buf.len = BUFFER_SIZE; |
153 | ::WSARecv( pPerHandle->s, &buf, 1, &dwRecv, &dwFlags, &pIoData->ol, NULL ); |
171 | DWORD WINAPI ServerThread( LPVOID lpParam ) |
173 | HANDLE hIocp = ( HANDLE )lpParam; |
180 | PPER_HANDLE_DATA pPerHandle; |
186 | BOOL bRet = ::GetQueuedCompletionStatus( hIocp, &dwTrans, ( LPDWORD )&pPerHandle, (LPOVERLAPPED*)&pPerIo, WSA_INFINITE ); |
189 | ::closesocket( pPerHandle->s ); |
190 | ::GlobalFree( pPerHandle ); |
191 | ::GlobalFree( pPerIo ); |
193 | cout << "error" << endl; |
198 | if ( dwTrans == 0 && ( pPerIo->nOperationType == OP_READ || pPerIo->nOperationType&nb-sp;== OP_WRITE ) ) |
200 | ::closesocket( pPerHandle->s ); |
201 | ::GlobalFree( pPerHandle ); |
202 | ::GlobalFree( pPerIo ); |
204 | cout << "client closed" << endl; |
208 | switch ( pPerIo->nOperationType ) |
212 | pPerIo->buf[dwTrans] = '\0' ; |
213 | printf ( "%s\n" , pPerIo->buf ); |
217 | buf.buf = pPerIo->buf; |
218 | buf.len = BUFFER_SIZE; |
219 | pPerIo->nOperationType = OP_READ; |
224 | ::WSARecv( pPerHandle->s, &buf, 1, &dwRecv, &dwFlags, &pPerIo->ol, NULL ); |