Python并发编程之一:并发编程相关基础概念

一、进程

1、定义

进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。

2、理解性定义

正在进行的一个过程或者说一个任务。而负责执行任务则是cpu。

3、任务管理器中的程序都是进程:

在这里插入图片描述

4、进程的创建

  • 系统初始化(查看进程linux中用ps命令,windows中用任务管理器,前台进程负责与用户交互,后台运行的进程与用户无关,运行在后台并且只在需要时才唤醒的进程,称为守护进程,如电子邮件、web页面、新闻、打印)

  • 一个进程在运行过程中开启了子进程(如nginx开启多进程,os.fork,subprocess.Popen等)

  • 用户的交互式请求,而创建一个新进程(如用户双击暴风影音)

  • 一个批处理作业的初始化(只在大型机的批处理系统中应用)

5、进程的终止

  • 正常退出(自愿,如用户点击交互式页面的叉号,或程序执行完毕调用发起系统调用正常退出,在linux中用exit,在windows中用ExitProcess)

  • 出错退出(自愿,python a.py中a.py不存在)

  • 严重错误(非自愿,执行非法指令,如引用不存在的内存,1/0等,可以捕捉异常,try…except…)

  • 被其他进程杀死(非自愿,如kill -9)

6、进程的层次结构

无论UNIX还是windows,进程只有一个父进程,不同的是:

  • 在UNIX中所有的进程,都是以init进程为根,组成树形结构。父子进程共同组成一个进程组,这样,当从键盘发出一个信号时,该信号被送给当前与键盘相关的进程组中的所有成员。

  • 在windows中,没有进程层次的概念,所有的进程都是地位相同的,唯一类似于进程层次的暗示,是在创建进程时,父进程得到一个特别的令牌(称为句柄),该句柄可以用来控制子进程,但是父进程有权把该句柄传给其他子进程,这样就没有层次了。

7、进程的状态

  • 进程挂起是自身原因,遇到I/O阻塞,便要让出CPU让其他进程去执行,这样保证CPU一直在工作

  • 与进程无关,是操作系统层面,可能会因为一个进程占用时间过多,或者优先级等原因,而调用其他的进程去使用CPU。

  • 进程的三种状态:
    在这里插入图片描述

8、进程并发的实现

  • 进程并发的实现在于:硬件中断一个正在运行的进程,把此时进程运行的所有状态保存下来。
  • 操作系统维护一张表格,即进程表(process table),每个进程占用一个进程表项(这些表项也称为进程控制块):
    在这里插入图片描述

二、串行、并发、并行

1、并发

1、定义:在操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行。

2、宏观:多个程序同时执行

3、微观:多个程序轮流在一个 CPU 上执行

2、并行

1、定义:在操作系统中,若干个程序段同时在系统中运行,这些程序的执行在时间上是重叠的,一个程序段的执行尚未结束,另一个程序段的执行已经开始,无论从微观还是宏观,程序都是一起执行的。

3、串行

1、定义:在计算机总线或其他数据通道上,每次传输一个位元数据,并连续进行以上单次过程的通信方式。与之对应的是并行通信,它在串行端口上通过一次同时传输若干位元数据的方式进行通信。

4、对比

1、并发:是伪并行,即看起来是同时运行。单个cpu+多道技术就可以实现并发,(并行也属于并发)

2、并行:同时运行,只有具备多个cpu才能实现并行

3、时间关系图:
在这里插入图片描述

三、同步、异步

1、同步

1、定义:在发出一个功能调用时,在没有得到结果之前,该调用就不会返回。

2、理解:在执行A事件的过程中发起了执行B事件的指令,必须要等待B事件执行完毕才能继续执行A事件的过程就是同步。

2、异步

1、定义:当一个异步功能调用发出后,调用者不能立刻得到结果。当该异步功能完成后,通过状态、通知或回调来通知调用者。

2、理解:在执行A事件的过程中发起了执行B事件的指令,不需要等待B事件执行完毕,就可以继续执行A事件的过程就是同步。

3、时间关系图:
在这里插入图片描述

四、阻塞、非阻塞

1、阻塞

1、定义:调用结果返回之前,当前线程会被挂起(如遇到io操作)。函数只有在得到结果之后才会将阻塞的线程激活。

2、性质:阻塞状态下 CPU 不工作

2、非阻塞

1、定义:在不能立刻得到结果之前也会立刻返回,同时该函数不会阻塞当前线程。

2、性质: 非阻塞状态下 CPU 在工作

五、线程

1、定义

1、定义:操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。

2、举例:一条流水线工作的过程,一条流水线必须属于一个车间,一个车间的工作过程是一个进程车间负责把资源整合到一起,是一个资源单位,而一个车间内至少有一个流水线,流水线的工作需要电源,电源就相当于cpu,所以,进程只是用来把资源集中到一起(进程只是一个资源单位,或者说资源集合),而线程才是cpu上的执行单位。

2、多线程:在一个进程中存在多个控制线程,多个控制线程共享该进程的地址空间,相当于一个车间内有多条流水线,都共用一个车间的资源。例如:北京地铁与上海地铁是不同的进程,而北京地铁里的13号线是一个线程,北京地铁所有的线路共享北京地铁所有的资源,比如所有的乘客可以被所有线路拉。

2、线程之间的关系

1、线程开销
如果我们的软件是一个工厂,该工厂有多条流水线,流水线工作需要电源,电源只有一个即cpu(单核cpu),一个车间就是一个进程,一个车间至少一条流水线(一个进程至少一个线程),创建一个进程,就是创建一个车间(申请空间,在该空间内建至少一条流水线),而建线程,就只是在一个车间内造一条流水线,无需申请空间,所以创建开销小。

2、线程之间的关系
车间直接是竞争/抢电源的关系(不同的进程直接是竞争关系,是不同的程序员写的程序运行的,迅雷抢占其他进程的网速,360把其他进程当做病毒干死),一个车间的不同流水线式协同工作的关系(同一个进程的线程之间是合作关系,是同一个程序写的程序内开启动,迅雷内的线程是合作关系,不会自己干自己)。

3、线程与进程的区别

  • 线程共享创建它的进程的地址空间;进程有自己的地址空间。

  • 线程可以直接访问其进程的数据段;进程有自己的父进程数据段副本。

  • 线程可以直接与其进程的其他线程通信;进程必须使用进程间通信来与同级进程通信。

  • 新线程很容易创建;新进程需要复制父进程。

  • 线程可以对同一进程的线程执行相当大的控制;进程只能对子进程执行控制。

  • 对主线程的更改(取消、优先级更改等)可能会影响进程的其他线程的行为;对父进程的更改不会影响子进程。

4、多线程的意义

  • 多线程共享一个进程的地址空间

  • 线程比进程更轻量级,线程比进程更容易创建可撤销,在许多操作系统中,创建一个线程比创建一个进程要快10-100倍,在有大量线程需要动态和快速修改时,这一特性很有用

  • 若多个线程都是cpu密集型的,那么并不能获得性能上的增强,但是如果存在大量的计算和大量的I/O处理,拥有多个线程允许这些活动彼此重叠运行,从而会加快程序执行的速度。

  • 在多cpu系统中,为了最大限度的利用多核,可以开启多个线程,比开进程开销要小的多。

  • 多线程的应用举例:开启一个字处理软件进程,该进程肯定需要办不止一件事情,比如监听键盘输入,处理文字,定时自动将文字保存到硬盘,这三个任务操作的都是同一块数据,因而不能用多进程。只能在一个进程里并发地开启三个线程,如果是单线程,那就只能是,键盘输入时,不能处理文字和自动保存,自动保存时又不能输入和处理文字。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值