Linux系统 epoll 系统调用学习

epoll 机制相比较 select 和 poll 机制的优势

  • 不需要维护文件描述符列表,不用轮询事件,所有的文件描述符事件操作交由内核完成,只需要等待内核通知就好
  • 时间复杂度为O(1)
  • 可监控的文件描述符几乎没有限制,轻易支持高并发

epoll 相关API函数说明

epoll_create

int epoll_create(int size);
  • 参数 size 没有实际意义,要求传入的参数大于0
  • 该函数执行成功后,会返回一个二五年文件描述符(epfd),该文件描述符标志在内核里创建epoll实例,之后的 epoll 相关API 都需要使用这个文件描述符才能访问 epoll 相关功能

epoll_ctl

int epoll_ctl(int epfd,int op,int sockfd,struct epoll_event *event);
  • 参数 epfdepoll_create() 创建产生的文件描述符
  • 参数 op 操作类型
操作类型说明
EPOLL_CTL_ADD注册新的fd到epfd中
EPOLL_CTL_MOD修改已经注册的fd的监听事件
EPOLL_CTL_DEL从epfd中删除一个fd
  • 参数 sockfd 向 epfd 实例中关联的 socket 文件描述符
  • 参数 event epoll 事件相关入参
struct epoll_event 结构体说明
typedef union epoll_data{   // epoll 事件的相关数据 联合体
    void* ptr;              // 在 nginx 的 epoll 机制中,只使用到了此成员
    int fd;
    __uint32_t u32;
    __uint64_t u64;

}epoll_data_t;

struct epoll_event{         // epoll 事件结构体
	uint32_t events;        // 事件标志位
	epoll_data_t data;      // 事件相关数据
};

在 epoll_event 结构体中,包含两个成员变量,一个是 data ,用来存储事件相关的数据,当事件发生时用户可以从这里拿来数据直接使用;
另外一个成员变量 events 是一个标志量,以位操作(bit set)指定了与 socket 关联的具体使事件,该标志位可以使用如下的宏进行配置。

事件类型说明
EPOLLIN读事件(read ready)
EPOLLOUT写事件(write ready)
EPOLLRDHUP客户端关闭链接(对应的文件描述符被挂断)
EPOLLPRI对应的文件描述符有紧急的数据可读
EPOLLERR对应的文件描述符发生错误
EPOLLET将 EPOLL 设置为边缘触发(Edge Triggered)模式
EPOLLONESHOT只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个 socket的话,需要再次把这个 socket 加入到EPOLL队列里
ET 和 LT

ET Edge Triggered 边缘触发
高速模式
只支持**非阻塞socket(no_block_socket)**调用
需要在 epoll_ctl() 函数中添加事件时使用标志位EPOLLET启用

LT Level Triggered 水平触发
默认模式 也成为低速模式
支持阻塞(blocksocket)和非阻塞socket调用

epoll_wait

int epoll_wait(int epfd,struct epoll_event *events,int maxevents,int timeout);
  • 参数 epfdepoll_create() 创建产生的文件描述符
  • 参数events 一个数组,长度为 maxevents,表明此次调用最多可以收集到 maxevents 个已经就绪的读写事件,实际的事件数由函数返回值决定
  • 参数timeoutepoll_wait() 阻塞等待的时间,单位是毫秒,只有在没有任何事件发生时才会阻塞,如果内核事件表中有事件就不会阻塞而是立即返回,因此 timeout 只是一个可能会阻塞等待的最长时间,不是绝对的阻塞时间

epoll 机制的高效体现在 Linux 内核只会拷贝已经就绪(ready)的事件来完成处理

测试代码

这里提供一份使用 epoll 机制实现的tcp server 服务器源码。可供学习 epoll 相关API参考。

编译

gcc -o epoll_test epoll.c

源码

// epoll.c
#include <sys/socket.h>
#include <sys/epoll.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdio.h>
#include <errno.h>
#include <stdlib.h>
#include <string.h>

#define MAXLINE		100
#define OPEN_MAX	100
#define LISTENQ		20
#define SERV_PORT	5555
#define INFTIM		1000

void setnonblocking(int sock)
{
	int opts;
	opts = fcntl(sock, F_GETFL);

	if(opts < 0) {
		perror("fcntl(sock, GETFL)");
		exit(1);
	}

	opts = opts | O_NONBLOCK;

	if(fcntl(sock, F_SETFL, opts) < 0) {
		perror("fcntl(sock, SETFL, opts)");
		exit(1);
	}
}

int main(int argc, char *argv[])
{
	printf("epoll socket test start.\n");
	int i, maxi, listenfd, connfd, sockfd, epfd, nfds;
	ssize_t n;
	char line[MAXLINE];
	socklen_t clilen;

	struct epoll_event ev, events[20];

	epfd = epoll_create(256);

	struct sockaddr_in clientaddr;
	struct sockaddr_in serveraddr;

	listenfd = socket(AF_INET, SOCK_STREAM, 0);

	setnonblocking(listenfd);

	ev.data.fd = listenfd;
	ev.events = EPOLLIN | EPOLLET;

	epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);

	bzero(&serveraddr, sizeof(serveraddr));
	serveraddr.sin_family = AF_INET;
	char *local_addr = "192.168.6.151";
	inet_aton(local_addr, &(serveraddr.sin_addr));
	serveraddr.sin_port = htons(SERV_PORT);

	bind(listenfd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));

	listen(listenfd, LISTENQ);

	maxi = 0;

	for(; ;) {
		nfds = epoll_wait(epfd, events, 20, 500);

		for(i = 0; i < nfds; ++i) {
			if(events[i].data.fd == listenfd) {
				printf("accept connection, fd is %d\n", listenfd);
				connfd = accept(listenfd, (struct sockaddr *)&clientaddr, &clilen);
				if(connfd < 0) {
					perror("connfd < 0");
					exit(1);
				}

				setnonblocking(connfd);

				char *str = inet_ntoa(clientaddr.sin_addr);
				printf("connect from %s\n", str);

				ev.data.fd = connfd;
				ev.events = EPOLLIN | EPOLLET;
				epoll_ctl(epfd, EPOLL_CTL_ADD, connfd, &ev);
			}
			else if(events[i].events & EPOLLIN) {
				if((sockfd = events[i].data.fd) < 0) continue;
				if((n = read(sockfd, line, MAXLINE)) < 0) {
					if(errno == ECONNRESET) {
						close(sockfd);
						events[i].data.fd = -1;
						printf("client disconnet");
					} else {
						printf("readline error");
					}
				} else if(n == 0) {
					close(sockfd);
					events[i].data.fd = -1;
				}else if(n>0)
				{
					printf("received data: %s\n", line);
					ev.data.fd = sockfd;
					ev.events = EPOLLOUT | EPOLLET;
					epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev);
				}
			}
			else if(events[i].events & EPOLLOUT) {
				sockfd = events[i].data.fd;
				write(sockfd, line, n);

				printf("written data: %s\n", line);

				ev.data.fd = sockfd;
				ev.events = EPOLLIN | EPOLLET;
				epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev);
			}
		}
	}
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

飘雪冰峰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值