到底应该怎么区分多进程、多线程和协程
-
进程:进程是系统资源分配的最小单位,一个运行的程序(代码)就是一个进程,它拥有自己独立的内存空间,所以进程间数据不共享,开销比较大。
进程是并行执行,即同一时刻多个任务可以同时运行, 多进程适合 CPU 密集型操作情况,CPU密集型大部份时间用来做计算、逻辑判断等 CPU 动作。 实现(多进程)并行的库有:multiprocessing
-
线程:调度执行的最小单位,也叫执行路径,不能独立存在,一个进程至少有一个线程,叫主线程,多个线程之间数据共享,极大地提高了程序的运行效率。
线程是并发执行,即在同一时间间隔内多个任务都在运行,但是并不会在同一时刻同时运行,存在交替执行的情 况。 多线程适合 IO 密集型操作情况,IO密集型大部分的状况是 CPU 在等 I/O (硬盘/内存)的读/写操作,(爬虫更适合使用多线程) 实现(多线程)并发的库有:threading
-
协程:是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器上下文和栈。 协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。