进程基础(操作系统中的概念)
进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。
狭义定义:进程是正在运行的程序的实例(an instance of a computer program that is being executed)。
广义定义:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。
进程它是操作系统总最重要的概念,也是最基本的一个概念
线程也是操作系统中得一个很重要的概念
进程和线程都是有操作系统来调度使用的,我们程序员是不能控制的,这里就设计到调度算法
计算机的核心是CPU,它承担了所有的计算任务。它就像一座工厂,时刻在运行。假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。一个车间里,可以有很多工人。他们协同完成一个任务。线程就好比车间里的工人。一个进程可以包括多个线程。
进程调度算法
要想多个进程交替运行,操作系统必须对这些进程进行调度,这个调度也不是随即进行的,而是需要遵循一定的法则,由此就有了进程的调度算法。
一、先来先服务调度算法
二、短作业优先调度算法
三、时间片轮转法
四、多级反馈队列
进程的并行和并发概念
并行: 并行是指两者同时执行
并发:一段时间内看起来是同时运行
同步异步阻塞非阻塞
同步:所谓同步就是一个任务的完成需要依赖另外一个任务时,只有等待被依赖的任务完成后,依赖的任务才能算完成,这是一种可靠的任务序列。要么成功都成功,失败都失败,两个任务的状态可以保持一致。
异步:异步是不需要等待被依赖的任务完成,只是通知被依赖的任务要完成什么工作,依赖的任务也立即执行,只要自己完成了整个任务就算完成了。至于被依赖的任务最终是否真正完成,依赖它的任务无法确定,所以它是不可靠的任务序列。
阻塞和非阻塞这两个概念与程序(线程)等待消息通知(无所谓同步或者异步)时的状态有关。也就是说阻塞与非阻塞主要是程序(线程)等待消息通知时的状态角度来说的
异步+非阻塞 是效率最高的
同步+阻塞 是效率最低的
如何创建进程
但凡是硬件,都需要有操作系统去管理,只要有操作系统,就有进程的概念,就需要有创建进程的方式,一些操作系统只为一个应用程序设计,比如微波炉中的控制器,一旦启动微波炉,所有的进程都已经存在。
from multiprocessing import Process
def task():
with open('a.txt', 'w', encoding='utf-8') as f:
f.write('helloworld')
if __name__ == '__main__':
#Windows平台上写法
p = Process(target=task) # 实例一个进程类,执行task任务
p.start() # 真正的开启进程
如何开启多进程
multiprocess模块
仔细说来,multiprocess不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便大家归类记忆,我将这部分大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享。
process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。
from multiprocessing import Process
import time
def task(name):
time.sleep(1)
if __name__ == '__main__':
start_time = time.time()
l = []
for i in range(10):
p=Process(target=task, kwargs={'name':'kk'})
p.start()
l.append(p)
for j in l:
j.join()
print("主进程总时间:", time.time() - start_time)