简单web服务器模型
要想实现一个简单的web服务器模型,一般有以下几种方法:
1. 多进程(主进程监听,有新的连接就fork一个子进程建立连接)
2. 多线程(主线程监听,有新的连接就新建一个子线程建立连接)
3. 使用系统函数select去监听,当有文件描述符就绪对其进行处理
4. 使用系统函数poll去监听,当有文件描述符就绪对其进行处理
5. 使用系统函数epoll去监听,当有文件描述符就绪对其进行处理
3,4,5都是单线程,基本原理就是有一个线程在监听是否有新的客户端请求,如果有的话就在此客户端和服务器之间建立一个连接。如果客户端传来有效数据之后该连接的文件描述符就处于就绪状态(在linux系统里一切都是以文件的形式存在,所以可以直接通过资源的文件描述符去操作系统资源),然后服务器会按顺序对就绪状态的文件进行处理。这就是i/o多路复用的本质。
为什么这样会快呢?
因为对于一个tcp请求,耗时主要在网络传输,属于i/o密集型,cpu处理单个请求一般很快,所以这里采用单线程处理,没有进程或者线程之间切换的开销,也避免了阻塞在无效的连接上(如有些客户端建立了连接但并没有传有效数据或请求,这种连接就没有必要占用过多系统资源去处理),因此在大多数情况下速度会快。
select代码实现
select是多路复用的第一个系统函数,他默认最多监听1024个文件描述符。后面我会再写博客介绍poll以及epoll。
下面是一个server的实现代码以及详细的注释,client给server传小写字母,server转化为大写字母并传回。
/*
使用select构建一个简单的server,实现i/o多路复用。select是单线程。
*/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/select.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#define MAXLINE 4096
#define SERV_PORT 8000
int main(int argc, char *argv[])
{
// maxi记录client数组里最大的一个存放有效文件描述符的下标
// maxfd为最大的一个文件描述符,作为select第一个参数
// listenfd作为server端监听是否有客户端连接的文件描述符
// connfd为一个新连接的文件描述符
// sockfd临时变量,当前就绪文件描述符,用于实际处理
int i, maxi, maxfd, listenfd, connfd, sockfd;
// nready为select返回参数,当前处于就绪态的文件描述符的个数。如果客户端只连接未发送有效数据,没有处于就绪态
// client数组存放有效文件描述符
int nready, client[FD_SETSIZE];
// n为read返回值
ssize_t n;
// fd_set类型为select模型里定义的结构体集合,rset为当前被select监听的文件描述符集合,allset相当于一个备份,用于记录之前被监听的集合
fd_set rset, allset;
//sockaddr_in类型为socket结构体,serv_addr为server端socket,cli_addr为client socket
struct sockaddr_in serv_addr, cli_addr;
// 接受数据缓冲区,client端数据首先会被读入buf
char buf[MAXLINE];
// client端socket长度
socklen_t client_len;
// 创建一个socket
// AF_INET指明ipv4, SOCK_STREAM指明流式协议,0表示使用默认协议为tcp
listenfd = socket(AF_INET, SOCK_STREAM, 0);
// 给serv_addr赋值用于绑定端口
bzero(&serv_addr, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
// 监听任意ip
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(SERV_PORT);
// 给server绑定端口
bind(listenfd, (struct sockaddr *)&serv_addr, sizeof(serv_addr));
// 第二个参数为监听数量的上限,默认128
listen(listenfd, 20);
// 刚开始最大的文件描述符就是listenfd
maxfd = listenfd;
maxi = -1;
// 初始化client数组为-1,表示无效数据
for(i = 0;i < FD_SETSIZE; i++)
{
client[i] = -1;
}
// 将监听集置0
FD_ZERO(&allset);
// 将listenfd放入监听集
FD_SET(listenfd, &allset);
printf("wait connecting...\n");
for (; ;)
{
// 每次循环之前将之前监听的fd集赋给当前集合
rset = allset;
// 参数依次为最大文件描述符,读文件描述符集合,写集合,error集合,超时时间
nready = select(maxfd + 1, &rset, NULL, NULL, NULL);
if (nready < 0)
{
printf("select error!\n");
exit(1);
}
// 新的连接
if (FD_ISSET(listenfd, &rset))
{
client_len = sizeof(cli_addr);
connfd = accept(listenfd, (struct sockaddr *)&cli_addr, &client_len);
for (i = 0; i < FD_SETSIZE; i++)
{
// 找到client数组第一个为-1的位置,将connfd放入client数组
if (client[i] < 0)
{
client[i] = connfd;
break;
}
}
if (i == FD_SETSIZE)
{
printf("too many clients!\n");
exit(1);
}
// 将connfd放入监听集合
FD_SET(connfd, &allset);
// 更新最大文件描述符
if (connfd > maxfd) maxfd = connfd;
// 更新最大存放有效数据下标
if (i > maxi) maxi = i;
// 如果只建立了一个新的连接,并没有被监听的其他文件描述符处于就绪状态,意味着没有数据需要处理,那么继续回到之前select阻塞状态,等待就绪再进行处理
if (--nready == 0) continue;
}
for (i = 0; i <= maxi; i++)
{
sockfd = client[i];
// 无效数据不处理
if (sockfd < 0) continue;
if (FD_ISSET(sockfd, &rset))
{
// 返回值为0表示客户端断开连接,关闭此连接socket并且从监听集移除
if ( (n = read(sockfd, buf, MAXLINE)) == 0)
{
close(sockfd);
FD_CLR(sockfd, &allset);
client[i] = -1;
}
// 业务逻辑,从缓冲区读入并且转成大写,写入文件描述符
else{
int j;
for (j = 0; j < n; j++)
{
buf[j] = toupper(buf[j]);
}
write(sockfd, buf, n);
}
if (--nready == 0) break;
}
}
}
close(listenfd);
return 0;
}
代码运行
将上面代码命名为server.c,使用
gcc -o server.o server.c
编译并链接源文件,生成可执行文件server.o。在当前文件夹运行此文件:
./server.o
就启动了服务器。
这里我没有放client端代码,不过可以使用系统命令:
nc localhost 8000
去模拟一个客户端请求(我服务器端口设置的8000,可以进行更改)。这样客户端服务器就可以进行通信了。
写在最后
陆陆续续看了好几次web服务器相关博客,但没有看相关代码实现。这次看到网上相关源码教程,认认真真学习了一下,终于理解了其中的原理。在此特别感谢https://www.bilibili.com/video/BV1Xb411K77g?p=20,讲解的很细致,想了解的可以去康康~