探索Linux下高性能异步I/O：用liburing实现的Echo服务器

张同学的成长记录

于 2024-04-21 17:12:03 发布

阅读量1.1k

点赞数 14

分类专栏： Linux网络编程文章标签：服务器 linux 运维

本文链接：https://blog.csdn.net/weixin_45634782/article/details/138038384

版权

Linux网络编程专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文介绍了异步I/O技术在现代服务器架构中的重要性，特别是liburing库如何简化Linux服务器的异步I/O操作。文章详细讲解了liburing的工作原理、性能优势、与同步I/O的对比，以及在服务器中的应用，包括代码示例和性能考量。

摘要由CSDN通过智能技术生成

引言

在现代服务器架构中，性能是王道。随着互联网的迅速发展，用户对服务的响应时间和可靠性有了更高的期待。在这种背景下，异步I/O（输入/输出）技术应运而生，它能够帮助开发者构建更高效、可扩展的服务器应用。异步I/O允许应用在等待一个长时间操作（如磁盘读写或网络请求）完成时继续执行其他任务，从而大幅提高应用性能和资源利用率。

在Linux系统中，liburing库代表了对异步I/O技术的一次重大进步。它提供了一种简洁而强大的接口，使得执行异步I/O操作变得既简单又高效。liburing的出现，为Linux服务器上运行的应用带来了前所未有的性能优化机会。

背景知识

异步I/O与同步I/O

在传统的同步I/O模型中，应用程序在发起一个I/O操作时必须等待该操作完成才能继续执行后续任务。这种模型简单直观，但在处理高并发请求时效率低下，因为I/O操作通常涉及等待外部资源（如磁盘访问或网络通信），导致CPU资源在此期间大量闲置。

相比之下，异步I/O允许程序在发起I/O操作后立即继续执行其他任务，无需等待I/O完成。这种方式可以显著提高程序的并行性和吞吐量，特别适合于需要处理大量并发连接和数据交换的服务器应用。

liburing简介

liburing是Linux内核中引入的一项新技术，旨在简化和优化异步I/O操作。通过提供一套简洁的API，liburing允许开发者轻松地将异步I/O集成到应用程序中，无需深入了解底层复杂的内核I/O机制。它通过两个主要的数据结构——提交队列（SQ）和完成队列（CQ）——以及一系列API函数，实现了对异步I/O请求的高效管理。

选择liburing来实现服务器的主要原因包括：

性能优势：liburing通过减少系统调用的数量和优化I/O操作的处理流程，能够显著提升应用的I/O性能。
易用性：相比于以前的异步I/O解决方案，如epoll和AIO，liburing提供了更加直观和易于使用的API。
灵活性和可扩展性：liburing支持广泛的I/O操作，包括文件读写、网络发送接收等，使得开发高性能服务器应用更加灵活和可扩展。

通过利用liburing，开发者可以更高效地处理高并发和大量数据，从而构建出响应更快、扩展性更强的服务器应用。

代码分析

代码放在文章最后，可以先看看框架分析！

服务器初始化

套接字创建和绑定：init_server函数的核心作用是准备服务器以便开始监听来自客户端的连接请求。首先，它通过调用socket()函数创建一个套接字。接下来，使用memset()将sockaddr_in结构体清零，确保结构体中不会有未初始化的数据。该结构体被配置为监听任何接入的地址（INADDR_ANY）并将端口号设置为函数参数指定的值。htonl()和htons()函数分别用于保证地址和端口号的字节顺序与网络字节顺序一致。最后，通过bind()函数将创建的套接字与指定的地址和端口号绑定，并调用listen()使得该套接字进入监听状态，等待客户端的连接请求。

设置I/O事件

接受连接：set_event_accept函数封装了将接受连接操作提交给io_uring的过程。它首先通过io_uring_get_sqe()获取一个提交队列条目（SQE），然后使用io_uring_prep_accept()准备一个接受连接的请求，并通过memcpy()将连接信息（包括文件描述符和事件类型）存储于SQE的用户数据中。这样，当连接请求完成时，可以从完成队列条目（CQE）中轻松检索到这些信息。

读取数据：set_event_recv函数负责准备接收数据的操作。它通过io_uring的接口提交一个读取请求，类似于接受连接的过程。这个函数指定了要读取的套接字文件描述符、缓冲区以及要读取的字节数，使得服务器能够异步接收来自客户端的数据。

发送数据：set_event_send函数将数据发送操作加入到io_uring的提交队列中。它指明了数据缓冲区的位置和大小，允许服务器异步向客户端发送数据。这是实现回声功能的关键一步——服务器读取到的数据将通过这一函数回送给客户端。

主循环与事件处理

事件循环：在主循环中，服务器通过调用io_uring_submit()提交所有准备好的I/O操作，并使用io_uring_wait_cqe()等待至少一个操作完成。这个循环允许服务器在一个非阻塞的方式下处理成百上千的并发连接和I/O请求。

处理连接：一旦有事件完成，服务器会根据事件的类型（接受、读取、写入）进行处理。对于每个完成的事件，服务器通过检查与事件关联的conn_info结构来确定下一步的操作，如接受新的连接、读取数据或发送数据。

应用场景

这种基于liburing的异步I/O服务器模型非常适合需要处理大量并发连接的应用场景，如高性能的Web服务器、实时消息系统和其他网络服务。它能够有效地减少I/O操作的延迟，提高CPU利用率，从而实现高吞吐量和低响应时间。

性能考量

与传统的基于线程或进程的同步I/O模型相比，基于liburing的异步I/O模型能够显著提升性能。传统模型中，每个I/O操作都可能导致线程阻塞，增加上下文切换的开销，且难以扩展到数千个并发连接。而异步I/O模型通过非阻塞操作和事件驱动机制，最小化了等待时间，允许单个进程或线程高效处理大量并发的I/O请求。这不仅减少了资源消耗（如线程数和内存占用），还提高了应用程序的响应速度和服务质量。
我们可以自己编写个程序去测试通过异步I/O实现的服务器性能，参考深入测量：使用C语言编写TCP服务器性能测试程序这篇文章

挑战与解决方案

错误处理

虽然提供的代码示例展示了liburing在实现异步I/O操作上的能力，但它并没有涵盖错误处理的方面，这在实际应用中是至关重要的。例如，当io_uring_get_sqe()无法获取提交队列条目（SQE）时，或者bind()、listen()在初始化服务器时失败，应当有相应的错误处理逻辑。

改进方案：

详细的错误日志：在关键操作失败时记录错误日志，包括失败的原因和失败发生的上下文，以便于问题定位和修复。
错误恢复：实施错误恢复策略，如重新尝试建立连接、重新提交I/O操作等，以确保服务器能够在遇到错误时继续正常运行。
资源清理：在操作失败时，确保及时释放已分配的资源，避免资源泄露。

资源管理

长时间运行的服务器必须有效管理其资源，尤其是文件描述符和内存，以避免资源耗尽导致服务不可用。

管理策略：

文件描述符限制：监控和限制打开的文件描述符数量，避免达到系统限制。在Linux系统中，可以使用ulimit命令来调整限制。
内存使用监控：定期检查内存使用情况，及时释放不再使用的内存。对于长时间保持开放的连接，考虑实现超时断开逻辑，释放长时间未使用的资源。
连接池：对于数据库和其他需要大量连接的资源，使用连接池可以有效管理连接，避免频繁开关连接带来的性能损耗。

结论

liburing为Linux服务器提供了一种高效的异步I/O实现方式，使得开发高性能网络应用变得更加容易和可靠。通过减少阻塞和上下文切换，liburing能够显著提高并发处理能力，减少延迟，提高吞吐量。这对于需要处理高并发连接和大量数据传输的现代网络服务来说，是一个巨大的优势。

通过合理利用liburing提供的异步I/O操作，结合有效的错误处理和资源管理策略，开发者可以构建出既高效又稳定的服务，满足日益增长的性能和可靠性需求。liburing的出现无疑是Linux异步I/O编程领域的一大进步，为开发者开辟了新的可能性，使得构建高性能的网络应用更加触手可及。

代码




#include <stdio.h>
#include <liburing.h>
#include <netinet/in.h>
#include <string.h>
#include <unistd.h>


#define EVENT_ACCEPT   	0
#define EVENT_READ		1
#define EVENT_WRITE		2

struct conn_info {
	int fd;
	int event;
};


int init_server(unsigned short port) {	

	int sockfd = socket(AF_INET, SOCK_STREAM, 0);	
	struct sockaddr_in serveraddr;	
	memset(&serveraddr, 0, sizeof(struct sockaddr_in));	
	serveraddr.sin_family = AF_INET;	
	serveraddr.sin_addr.s_addr = htonl(INADDR_ANY);	
	serveraddr.sin_port = htons(port);	

	if (-1 == bind(sockfd, (struct sockaddr*)&serveraddr, sizeof(struct sockaddr))) {		
		perror("bind");		
		return -1;	
	}	

	listen(sockfd, 10);
	
	return sockfd;
}



#define ENTRIES_LENGTH		1024
#define BUFFER_LENGTH		1024

int set_event_recv(struct io_uring *ring, int sockfd,
				      void *buf, size_t len, int flags) {

	struct io_uring_sqe *sqe = io_uring_get_sqe(ring);

	struct conn_info accept_info = {
		.fd = sockfd,
		.event = EVENT_READ,
	};
	
	io_uring_prep_recv(sqe, sockfd, buf, len, flags);
	memcpy(&sqe->user_data, &accept_info, sizeof(struct conn_info));

}


int set_event_send(struct io_uring *ring, int sockfd,
				      void *buf, size_t len, int flags) {

	struct io_uring_sqe *sqe = io_uring_get_sqe(ring);

	struct conn_info accept_info = {
		.fd = sockfd,
		.event = EVENT_WRITE,
	};
	
	io_uring_prep_send(sqe, sockfd, buf, len, flags);
	memcpy(&sqe->user_data, &accept_info, sizeof(struct conn_info));

}



int set_event_accept(struct io_uring *ring, int sockfd, struct sockaddr *addr,
					socklen_t *addrlen, int flags) {

	struct io_uring_sqe *sqe = io_uring_get_sqe(ring);

	struct conn_info accept_info = {
		.fd = sockfd,
		.event = EVENT_ACCEPT,
	};
	
	io_uring_prep_accept(sqe, sockfd, (struct sockaddr*)addr, addrlen, flags);
	memcpy(&sqe->user_data, &accept_info, sizeof(struct conn_info));

}




int main(int argc, char *argv[]) {

	unsigned short port = 9999;
	int sockfd = init_server(port);

	struct io_uring_params params;
	memset(&params, 0, sizeof(params));

	struct io_uring ring;
	io_uring_queue_init_params(ENTRIES_LENGTH, &ring, &params);

	
#if 0
	struct sockaddr_in clientaddr;	
	socklen_t len = sizeof(clientaddr);
	accept(sockfd, (struct sockaddr*)&clientaddr, &len);
#else

	struct sockaddr_in clientaddr;	
	socklen_t len = sizeof(clientaddr);
	set_event_accept(&ring, sockfd, (struct sockaddr*)&clientaddr, &len, 0);
	
#endif

	char buffer[BUFFER_LENGTH] = {0};

	while (1) {

		io_uring_submit(&ring);


		struct io_uring_cqe *cqe;
		io_uring_wait_cqe(&ring, &cqe);

		struct io_uring_cqe *cqes[128];
		int nready = io_uring_peek_batch_cqe(&ring, cqes, 128);  // epoll_wait

		int i = 0;
		for (i = 0;i < nready;i ++) {

			struct io_uring_cqe *entries = cqes[i];
			struct conn_info result;
			memcpy(&result, &entries->user_data, sizeof(struct conn_info));

			if (result.event == EVENT_ACCEPT) {

				set_event_accept(&ring, sockfd, (struct sockaddr*)&clientaddr, &len, 0);
				//printf("set_event_accept\n"); //

				int connfd = entries->res;

				set_event_recv(&ring, connfd, buffer, BUFFER_LENGTH, 0);

				
			} else if (result.event == EVENT_READ) {  //

				int ret = entries->res;
				//printf("set_event_recv ret: %d, %s\n", ret, buffer); //

				if (ret == 0) {
					close(result.fd);
				} else if (ret > 0) {
					set_event_send(&ring, result.fd, buffer, ret, 0);
				}
			}  else if (result.event == EVENT_WRITE) {
  //

				int ret = entries->res;
				//printf("set_event_send ret: %d, %s\n", ret, buffer);

				set_event_recv(&ring, result.fd, buffer, BUFFER_LENGTH, 0);
				
			}
			
		}

		io_uring_cq_advance(&ring, nready);
	}

}