线程,协程,IO多路复用知识

最新推荐文章于 2024-09-29 15:55:49 发布

小智RE0

最新推荐文章于 2024-09-29 15:55:49 发布

阅读量1.5k

点赞数 3

分类专栏： Linux 文章标签：操作系统

本文链接：https://blog.csdn.net/mrtumnus/article/details/123974437

版权

Linux 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

文章目录

1.线程,协程
2.IO 多路复用

1.线程,协程

线程作为CPU的最小调度单位,

比如说一个单核的CPU,目前需要执行3个线程,

方式(1) :频繁地切换,直到完成3个线程;
方式(2) :执行完一个线程后再切换;

两种方式执行的效率其实都一样.

在这里插入图片描述

引入到IO的知识, IO这方面主要是磁盘的读写,网络数据传输…
常用的操作有:磁盘IO,网络IO.

在实际的IO中,有这么一个DMA[Direct Memory Access]直接访问内存.

百度关于DMA的解释

(1)首先是CPU向DMA下达指令,其中包含了磁盘设备信息以及文件的位置.
(2)DMA去通知硬盘进行文件读取;
(3)硬盘读取时,会将文件的内容读取到内存中;
(4)硬盘通知DMA 文件读取好了;
(5)DMA 通知CPU 文件读取好了,
(6)CPU才去内存读取文件内容

在这里插入图片描述

经过这样的流程::注意到CPU自从给DMA下发了读取文件的指令后,自己就闲置;此时可以来做其他的事情; 比如说可以执行其他的线程了呢.
宏观来看就像是一种并行的方式在读取文件.

线程作为操作系统级别的执行单元,如果需要用多线程就得调用到操作系统底层的API;
线程切换又涉及到内核态与用户态的切换.

那么协程的出现即可解决该效率问题; 协程 作为编程语言级别的线程;协程在处理时完全处于用户态;且为非抢占式的;在一个线程内可以包含多个协程;

2.IO 多路复用

IO多路复用的场景:一个高性能的服务器,可以同时提供给多个客户端的连接且处理请求;
在这里插入图片描述

如果采用多线程,虽然也可以解决,但由于涉及线程的切换,会影响到效率.
那么使用单线程;
比如说现在客户端A发出了请求,服务器正在处理,客户端B发来请求,那么是否会打断请求呢?

那么实际上不会影响的, 由于DMA专业处理IO,所以不用担心数据丢失的问题.

在linux系统中一切都是文件,每一个网络连接都是文件描述符的方式存在;
简称为fd

单线程读取大概可以这样子暴力去写一段程序;

while(true){
//for循环查看所有的网络连接;
for( all){
//有数据就读取;
//if(....){.....}
}
}

select函数操作

在这里插入图片描述

开始时读文件的操作符集合set使用的 bitmap 使用 1 是监听fd的标志，
在select之后，rset中没有数据的会被置位0，有数据的会被置位1

在select操作时,实际会把判断是否为读操作这个过程交给内核态处理;
用户态的权限本来就比较低,出于安全角度,只有内核态才能处理文件相关的操作;
select 函数本身也是个阻塞函数,当没有数据出现时处于阻塞状态;;

在select操作中的参数中为什么是 max+1 呢;

select 的几个缺点;
(1) 首先这个select 中使用的 bitmap结构有1024限制;
(2)FDset 不可重用;
(3) 虽然是将rset 从用户态转移到了内核态,但是仍然有一定的资源消耗;
(4)注意在select之后还需要一个 for循环去置位处理

poll函数操作

类似于select,没有数据时,poll函数会进行阻塞;
不过有数据时:

(1)置位的是数组中的 revents字段; 这个revents默认一开始为0,当有数据过来之后,
(2)进行poll返回

在这里插入图片描述
可以看到 poll函数 解决了 select函数的一些问题:
比如说他这里就没有用bitmap结构; 且对revents进行了重置为0,保证了重用性.

epoll函数操作

注意在epoll中的操作,不需要从用户态将数据拷贝一份给内核态,而是让两方使用这同一份的数据;
解决了拷贝数据时的开销问题;

无数据时也是阻塞状态;

有数据时;
(1)先置位: 通过重排置位,将有数据的fd放置到最前面的位置;
(2)同样是返回,不过这里会返回真实含有数据的 fd个数; 即 nfds

在这里插入图片描述

最终只需要遍历 nfds次即可,提升了操作的效率