1.线程,协程
线程作为CPU的最小调度单位,
比如说一个单核的CPU,目前需要执行3个线程,
- 方式(1) :频繁地切换,直到完成3个线程;
- 方式(2) :执行完一个线程后再切换;
两种方式执行的效率其实都一样.
引入到IO的知识, IO这方面主要是磁盘的读写,网络数据传输…
常用的操作有:磁盘IO,网络IO.
在实际的IO中,有这么一个DMA
[Direct Memory Access]直接访问内存.
百度关于DMA的解释
(1)首先是CPU
向DMA
下达指令,其中包含了磁盘设备信息以及文件的位置.
(2)DMA去通知硬盘进行文件读取;
(3)硬盘读取时,会将文件的内容读取到内存中;
(4)硬盘通知DMA
文件读取好了;
(5)DMA 通知CPU
文件读取好了,
(6)CPU才去内存读取文件内容
经过这样的流程::注意到
CPU
自从给DMA
下发了读取文件的指令后,自己就闲置;此时可以来做其他的事情; 比如说可以执行其他的线程了呢.
宏观来看就像是一种并行的方式在读取文件.
线程作为操作系统级别的执行单元,如果需要用多线程就得调用到操作系统底层的API;
线程切换又涉及到内核态与用户态的切换.
那么协程的出现即可解决该效率问题; 协程
作为编程语言级别的线程;协程在处理时完全处于用户态;且为非抢占式的;在一个线程内可以包含多个协程;
2.IO 多路复用
IO多路复用的场景:一个高性能的服务器,可以同时提供给多个客户端的连接
且处理请求
;
如果采用多线程,虽然也可以解决,但由于涉及线程的切换,会影响到效率.
那么使用单线程;
比如说现在客户端A发出了请求,服务器正在处理,客户端B发来请求,那么是否会打断请求呢?
那么实际上不会影响的, 由于DMA
专业处理IO,所以不用担心数据丢失的问题.
在linux系统中一切都是文件,每一个网络连接都是文件描述符的方式存在;
简称为fd
单线程读取大概可以这样子暴力去写一段程序;
while(true){
//for循环查看所有的网络连接;
for( all){
//有数据就读取;
//if(....){.....}
}
}
select函数 操作
开始时读文件的操作符集合set使用的
bitmap
使用 1 是监听fd的标志,
在select之后,rset中没有数据的会被置位0,有数据的会被置位1
- 在select操作时,实际会把判断是否为读操作这个过程
交给内核态处理
; - 用户态的权限本来就比较低,出于安全角度,只有内核态才能处理文件相关的操作;
- select 函数本身也是个阻塞函数,当没有数据出现时处于阻塞状态;;
在select操作中的 参数中为什么是 max+1
呢;
select 的几个缺点;
(1) 首先 这个select 中使用的 bitmap结构有1024限制;
(2)FDset
不可重用;
(3) 虽然是将rset 从用户态转移到了内核态,但是仍然有一定的资源消耗;
(4)注意在select之后还需要一个 for循环去置位处理
poll函数 操作
类似于select,没有数据时,poll函数会进行阻塞;
不过有数据时:
- (1)置位的是数组中的 revents字段; 这个
revents
默认一开始为0,当有数据过来之后, - (2)进行poll返回
可以看到 poll函数
解决了 select函数
的一些问题:
比如说他这里就没有用bitmap结构; 且对revents
进行了重置为0,保证了重用性.
epoll函数 操作
注意在epoll中的操作,不需要从用户态将数据拷贝一份给内核态,而是让两方 使用这同一份的 数据
;
解决了拷贝数据时的开销问题;
无数据时也是阻塞状态;
有数据时;
(1)先置位: 通过重排置位,将有数据的fd
放置到最前面的位置;
(2)同样是返回,不过这里会返回真实含有数据的 fd个数
; 即 nfds
最终只需要遍历 nfds次
即可,提升了操作的效率