python进程池概念_Python-进程-进程池-原理

进程

资源集合,调度和分配资源,说到进程就不得不提到线程,线程和进程是密不可分,进程申请了资源,但真正使用资源的是线程,其实本质上类似面向对象的思想,面向对象把数据和数据的操作封装在一个类中,进程把资源和对资源的操作封装在进程中,其实进程本质上是对资源的封装,那就比对进程和线程的区别来认识进程:

1. 进程是资源容器,真正使用资源的是线程,进程可以申请并拥有自己独立资源但线程不能,线程只能使用进程已有的资源

2. 进程在CPU上执行体现在线程,一个进程至少有一个主线程,可以有0个或者多个子线程

3. 从粒度角度看,进程粒度远远比线程大,进程粒度比线程小,也就是切换进程消耗远比线程切换大

4. 线程是操作系统调度的最小单位,对于IO操作进程和线程差别不大,进程和线程都可以竞争CPU资源,归根到本质上是线程在竞争CPU资源

5. 进程与进程之间是资源完全隔离,也就是说不可互相访问

北门吹雪: http://www.cnblogs.com/2bjiujiu/

Python进程模块  multiprocessing

# 这个模块的接口和线程模块threading一致

多进程实例过程:

1. 实例进程

2. 启动子进程

3. 等待子进程结束

import multiprocessing

def add(end, name):

total = 0

for i in range(end+1):

total += i

print(name)

return total

if __name__ == '__main__':

# 实例子进程

ps = multiprocessing.Process(target=add, args=(100, "北门吹雪"), name="北门吹雪")

# 启动子进程

ps.start()

# 等待子进程结束

ps.join()

进程池      Pool

# 接口和线程池一致,可以获取进程状态,如子进程执行结果、否准备、是否执行成功、等待子进程执行完成

1. 实例进程池,需要传递进程池数量

2. 添加子进程到进程池中

3. 先关闭Pool,禁止进程池再接收任务

4. 等待进程池中进程完成

6. 关闭进程池

import multiprocessing

def add(end, name, blog):

total = 0

for i in range(end+1):

total += i

print(name, total, blog)

return total

if __name__ == '__main__':

# 实例子进程,和CPU数量一致

ps_pool = multiprocessing.Pool(multiprocessing.cpu_count())

# 提交任务,获得返回进程对象对象, 可在此提交多个进程

r = ps_pool.apply_async(func=add, args=(100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"))

# 获取执行结果,状态信息

print(r.get())

# print(r.wait())

print(r.ready())

print(r.successful())

# 关闭线程池

ps_pool.close()

# 等待子线程完成

ps_pool.join()

7. 进程池获取子进程状态

执行结果    .get

是否就绪    .ready

是否执行成功  .successful

等待子进程   .wait

8. 进程池imap方法, 特点是进程函数名不变,改变的传递进去的参数,结果是进程返回的结果,有先后顺序

import multiprocessing

def add(info):

end = info[0]

name = info[1]

blog = info[2]

total = 0

for i in range(end+1):

total += i

print(end, name, blog)

return total

if __name__ == '__main__':

# 实例子进程,和CPU数量一致

ps_pool = multiprocessing.Pool(multiprocessing.cpu_count())

# imap方式

info = [(100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), (200, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/")]

# imap方式

for total in ps_pool.imap(add, info):

print(total)

北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

进程之间通信机制

# 本质上是通过共享内存块实现通信

1. 多进程Queue

import multiprocessing

def add(ps_queue, end, name, blog):

total = 0

for i in range(end+1):

total += i

print(name, blog)

ps_queue.put(total)

if __name__ == '__main__':

# 实例队列

ps_queue = multiprocessing.Queue()

# 实例子进程

ps = multiprocessing.Process(target=add, args=(ps_queue, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")

# 启动子进程

ps.start()

# 等待子进程结束

ps.join()

# 从Queue中取值

print(ps_queue.get())

2. 管道  Pipe,只适于两个进程中通信,性能优于Queue

import multiprocessing

def add(phone_one, end, name, blog):

total = 0

for i in range(end+1):

total += i

print(name, blog)

# 发送数据,当然也可以接收

phone_one.send(total)

if __name__ == '__main__':

# 实例管道, 类似打电话

phone_one, phone_two = multiprocessing.Pipe()

# 实例子进程

ps = multiprocessing.Process(target=add, args=(phone_one, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")

# 启动子进程

ps.start()

# 等待子进程结束

ps.join()

# Pipe中取值

print(phone_two.recv())

3. 共享内存  Manager 包含Python基本数据结构

import multiprocessing

from multiprocessing import Manager

def add(share_list, end, name, blog):

total = 0

for i in range(end+1):

total += i

print(name, blog)

# 添加数据

share_list.append(total)

share_list.append(name)

share_list.append(blog)

if __name__ == '__main__':

# 实例共享内存对象

share_memory = multiprocessing.Manager()

# 实例list数据类型,当然除了list包括Python基本数据结构

share_list = share_memory.list()

# 实例子进程

ps = multiprocessing.Process(target=add, args=(share_list, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")

# 启动子进程

ps.start()

# 等待子进程结束

ps.join()

# 从共享对象中取值

print(share_list)

北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

计算机资源:

1. 内存、磁盘、CPU、网卡这4个是计算机核心资源

2. 资源是稀缺的,需要竞争计算机资源

3. 进程操作系统调度分配资源的单位,每个应用至少有一个进程

4. 进程是竞争计算机资源的单位,CPU可以在不同的应用程序中切换,这个时间非常短暂,宏观上是并行,这个理念在在单核上,多核CPU可以并行执行多个进程

5. 进程调度最核心的功能,操作系统会有自己算法,决定进程是否挂起,进程和线程的切换开销非常大,将CPU资源消耗在进程和线程切换上,时间片,频繁切换和保存进程上下文消耗CPU资源

北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

经验:

1. 进程和线程都能竞争CPU资源,并且线程包含在进程中,同时存在又同时消亡(这里说主进程和主线程),进程和线程边界不清晰,这让进程和线程概念更加难以理清

2. 进程和线程在逻辑上由非常多的相似点,如实例方式、启动方式、堵塞方式、池的概念、锁的概念,线程更像缩小版进程,但不是进程,包含在进程中只能使用进程分配已经有的资源

3. 进程与进程之间资源隔离,不可互相访问,线程之间只能访问各自进程中的资源,并不是广义上的可以互相访问资源

4. 进程用面向对象的语义来说,把资源和对资源的操作封装在一个进程中

5. 进程切换消耗远大于线程,但为何还是需要进程,因为进程很像静态资源,使用静态资源效率上远比动态资源来的效率高,一般进程数量和CPU总核心数一致,但还是需要考虑安全冗余,不要把所有CPU跑满

北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值