一、多线程模型概述
在处理多用户请求的场景中,我们发现进程间上下文切换的负担过重。为了减轻这种负担,多线程模型被引入。线程作为运行在进程中的“逻辑流”,单个进程能容纳多个线程同时运行。同进程内的线程能够共享进程的多种资源,像文件描述符列表、进程空间、代码、全局数据、堆、共享库等。在上下文切换时,由于这些共享资源无需切换,只需切换线程的私有数据和寄存器等不共享的数据,所以线程上下文切换的开销明显小于进程切换。在服务器与客户端的 TCP 连接场景中,通过 pthread_create()
函数创建线程,并将「已连接 Socket」的文件描述符传递给线程函数,随后线程就能与客户端进行通信,实现并发处理。
然而,如果每出现一个连接就创建一个新线程,待线程任务结束后又由操作系统销毁。尽管单个线程切换的开销不大,但频繁地创建和销毁线程会给系统带来显著的开销。为解决这一问题,线程池的方式被采用。线程池提前创建若干线程,新连接建立时,将已连接的 Socket 放入全局队列,线程池中的线程负责从队列中取出进行处理。但要注意,由于这个队列是全局的且多个线程会操作,为防止多线程竞争,线程在操作队列前需加锁。
不过,即使采用了上述基于进程或线程的模型,仍存在重大问题。当面临大量的 TCP 连接,例如要达到 C10K(即一台机器维护 1 万个连接)的情况,就意味着要为 1 万个连接分别分配进程或线程。这对于操作系统来说是难以承受的巨大压力。想象一下,操作系统需要同时管理 1 万个进程或线程的资源分配、调度、上下文切换等,其资源消耗和复杂性将呈指数级增长。例如,内存资源会被大量占用,CPU 调度的负担会急剧加重,系统的整体性能和响应能力会大幅下降,甚至可能导致系统崩溃。以一个大型的网络直播平台为例,如果同时有 1 万个观众进行连接,按照传统的进程或线程模型为每个连接分配资源,操作系统很可能无法及时有效地处理这么多的任务,导致直播出现卡顿、延迟甚至中断的情况。
所以,单纯依靠传统的进程或线程模型来应对大规模的并发连接需求,在实际应用中往往会遇到难以突破的瓶颈,需要寻求更创新和高效的解决方案。
二、多线程模型服务端代码
#include<stdio.h>
#include<string.h>
#include<unistd.h>
#include<pthread.h>
#include<fcntl.h>
#include<sys/socket.h>
#include<netinet/ip.h>
#include<arpa/inet.h>
这段代码是一个简单的多线程TCP服务器程序。主要逻辑如下:
- 在main函数中,首先创建一个TCP套接字,并进行绑定和监听操作,等待客户端连接。
- 当有客户端连接进来时,通过accept函数接受连接,并返回一个新的套接字描述符scfd,代表与该客户端的通信套接字。
- 接下来,创建一个新线程,并通过pthread_create函数将通信套接字作为参数传递给线程函数thread。
- 在线程函数thread中,首先将套接字描述符转换为整型,并通过读取函数read从套接字中读取数据到缓冲区buf中。
- 然后,使用write函数将读取到的数据输出到标准错误输出上,相当于将数据打印到控制台。
- 最后,再次使用write函数将数据写回到套接字中,实现将数据反射回客户端。
- 主线程会继续回到循环开始的位置,等待下一个客户端连接。