多线程与并发服务器设计(23-1)

最新推荐文章于 2024-02-29 16:32:54 发布

李生龙

最新推荐文章于 2024-02-29 16:32:54 发布

阅读量890

点赞数 1

分类专栏： moduo网络 linux并发网络编程相关

linux并发网络编程相关同时被 2 个专栏收录

93 篇文章 2 订阅

订阅专栏

moduo网络

8 篇文章 0 订阅

订阅专栏

常见并发服务器方案

1、循环式/迭代式( iterative )服务器
    无法充分利用多核CPU，不适合执行时间较长的服务
2、并发式(concurrent)服务器
one connection per process/one connection per thread
    适合执行时间比较长的服务
3、prefork or pre threaded（UNP2e 第27章）
4、反应式( reactive )服务器 (reactor模式)
    并发处理多个请求，实际上是在一个线程中完成。无法充分利用多核CPU
不适合执行时间比较长的服务，所以为了让客户感觉是在“并发”处理而不是“循环”处理，每个请求必须在相对较短时间内执行。
5、reactor + thread per request（过渡方案）
6、reactor + worker thread（过渡方案）

7、reactor + thread pool（能适应密集计算）
8、multiple reactors（能适应更大的突发I/O）
    reactors in threads（one loop per thread）
    reactors in processes
9、multiple reactors + thread pool（one loop per thread + threadpool）（突发I/O与密集计算）
10、proactor服务器(proactor模式，基于异步I/O)
    理论上proactor比reactor效率要高一些
异步I/O能够让I/O操作与计算重叠。充分利用DMA特性。
Linux异步IO
glibc aio（aio_*），有bug
kernel native aio（io_*），也不完美。目前仅支持 O_DIRECT 方式来对磁盘读写，跳过系统缓存。要自已实现缓存，难度不小。
boost asio实现的proactor，实际上不是真正意义上的异步I/O，底层是用epoll来实现的，模拟异步I/O的。

iterative服务器

iterative 只能使用短连接，只有一个线程，如果使用长连接，那么其他请求就无法得到响应！

处理完一个连接，然后关闭连接。

这种服务器有很多缺陷：

单线程，不能充分利用多核cpu
因为是短链接，有可能上一次断开的连接就是本次的连接，这样效率明显下降
不能并发处理

concurrent服务器

这种服务器，因为是多线程或者多进程的，所以能并发处理请求。

注：如果是多进程，记得关闭监听套接字，因为子进程会继承套接字。

如果是多线程，就不用关闭监听套接字了，因为线程没有继承打开的套接字。

prefork服务器

这种服务器由于多个进程在accept等待中，当一个请求到达时，都会被触发，但是只有一个成功返回。这是一种“惊群”现象。

basic reactor （4）

并发处理，但是是单线程的。

reactor+threadpool（7 第5中的改正）

一个IO线程，多个compute线程，适用于计算密集型

multiple reactors

roll robin

multiple reactors+threadpool

二、

一、3点基础知识

1、一个主机的端口号为所有进程所共享，但普通用户进程绑定不了一些特殊端口号如20、80等。

2、每个进程都有自己的文件描述符（包括file fd, socket fd, timer fd, event fd, signal fd），一般是1024，可以通过ulimit -n 设置，但所有进程打开的文件描述符总数有上限，跟主机的内存有关。

3、一个进程内的所有线程共享进程的文件描述符。

二、常见并发服务器方案：

1、循环式/迭代式( iterative )服务器
无法充分利用多核CPU，不适合执行时间较长的服务，即适用于短连接。如果是长连接则需要在read/write之间循环，那么只能服务一个客户端。

2、并发式(concurrent)服务器
one connection per process/one connection per thread

适合执行时间比较长的服务

one connection per process : 主进程每次fork 之后要关闭connfd，子进程要关闭listenfd

one connection per thread : 主线程每次accept 回来就创建一个子线程服务，由于线程共享文件描述符，故不用关闭。

3、prefork or pre threaded（UNP2e 第27章）（容易发生“惊群”现象，即多个子进程都处于accept状态）

4、反应式( reactive )服务器 (reactor模式)（select/poll/epoll）
并发处理多个请求，实际上是在一个线程中完成。无法充分利用多核CPU
不适合执行时间比较长的服务，所以为了让客户感觉是在“并发”处理而不是“循环”处理，每个请求必须在相对较短时间内执行。

5、reactor + thread per request（过渡方案）

6、reactor + worker thread（过渡方案）

7、reactor + thread pool（能适应密集计算）

8、multiple reactors（能适应更大的突发I/O）

reactors in threads（one loop per thread）
reactors in processes

一般来说一个subReactor适用于一个千兆网口

9、multiple reactors + thread pool（one loop per thread + threadpool）（突发I/O与密集计算）

subReactor可以有多个，但threadpool只有一个。

10、proactor服务器(proactor模式，基于异步I/O)

理论上proactor比reactor效率要高一些

异步I/O能够让I/O操作与计算重叠。充分利用DMA特性。

Linux异步IO

glibc aio（aio_*），有bug

kernel native aio（io_*），也不完美。目前仅支持 O_DIRECT 方式来对磁盘读写，跳过系统缓存。要自已实现缓存，难度不小。

boost asio实现的proactor，实际上不是真正意义上的异步I/O，底层是用epoll来实现的，模拟异步I/O的。

常见并发服务器方案比较：

三、一些常见问题

1、Linux能同时启动多少个线程？

对于 32-bit Linux，一个进程的地址空间是 4G，其中用户态能访问 3G 左右，而一个线程的默认栈 (stack) 大小是 8M，心算可知，一个进程大约最多能同时启动 350 个线程左右。

2、多线程能提高并发度吗？

如果指的是“并发连接数”，不能。

假如单纯采用 thread per connection 的模型，那么并发连接数大约350，这远远低于基于事件的单线程程序所能轻松达到的并发连接数（几千上万，甚至几万）。所谓“基于事件”，指的是用 IO multiplexing event loop 的编程模型，又称 Reactor 模式。

3、多线程能提高吞吐量吗？

对于计算密集型服务，不能。

如果要在一个8核的机器上压缩100个1G的文本文件，每个core的处理能力为200MB/s，那么“每次起8个进程，一个进程压缩一个文件”与“只启动一个进程（8个线程并发压缩一个文件）”，这两种方式总耗时相当，但是第二种方式能较快的拿到第一个压缩完的文件。

4、多线程能提高响应时间吗？

可以。参考问题3

5、多线程如何让I/O和计算重叠

多线程程序如何让I/O和计算重叠，降低latency（迟延）

例：日志（logging），多个线程写日志，由于文件操作比较慢，服务线程会等在IO上，让CPU空闲，增加响应时间。

解决办法：单独用一个logging线程负责写磁盘文件，通过BlockingQueue提供对外接口，别的线程要写日志的时候往队列一塞就行，这样服务线程的计算和logging线程的磁盘IO就可以重叠。

如果异步I/O成熟的话，可以用protator模式。