python 进程

linux创建子进程
  1. Linux创建子进程的原理:
    1). 父进程和子进程, 如果父进程结束, 子进程也随之结束;
    2). x先有父进程, 再有子进程, 通过fork函数实现;

  2. fork函数的返回值:调用该方法一次, 返回两次;

    • 产生的子进程返回一个0
    • 父进程返回子进程的pid;
  3. Window也能使用fork函数么?
    Windows没有fork函数, Mac有fork函数(Unix -> Linux, Unix-> Mac),
    封装了一个模块multiprocessing

  4. 常用方法:

    • os.fork()
    • os.getpid(): 获取当前进程的pid;
    • os.getppid(): parent process id, 获取当前进程的父进程的id号;
import  os
import  time
print("当前进程(pid=%d)正在运行..." %(os.getpid()))
print("当前进程的父进程(pid=%d)正在运行..." %(os.getppid()))
print("正在创建子进程......")
pid1 = os.fork()
print("第1个:", pid1)
if pid1 == 0:
    print("这是创建的子进程, 子进程的id为%s, 父进程的id为%s"
          %(os.getpid(), os.getppid()))
else:
    print("当前是父进程[%s]的返回值%s" %(os.getpid(), pid1))
time.sleep(1)

在这里插入图片描述

创建子进程
  • 实例化对象实现:
import multiprocessing
def job():
    print("当前子进程的名称为%s" %(multiprocessing.current_process()))
# 创建一个进程对象
p1 = multiprocessing.Process(target=job)
# 运行多进程, 执行任务
p1.start()
# 创建一个进程对象
p2 = multiprocessing.Process(target=job)
# 运行多进程, 执行任务
p2.start()
# 等待所有的子进程执行结束, 再执行主进程的内容
p1.join()
p2.join()
print("任务执行结束.....")

在这里插入图片描述

  • 通过继承的方式:
import multiprocessing
class JobProcess(multiprocessing.Process):
# 重写Process的构造方法, 获取新的属性
    def __init__(self,queue):
        super(JobProcess,self).__init__()
        self.queue = queue
    # 重写run方法, 将执行的任务放在里面即可 
    def run(self):
        print("当前子进程的名程为%s"%(multiprocessing.current_process()))
processes = []
# 启动10个子进程, 来处理需要执行的任务;
for i in range(10):
# 实例化对象;
    p = JobProcess(queue=3)
    processes.append(p)
     # 启动多进程, 处理需要执行的任务;
    p.start()
# 等待所有的子进程执行结束, 再继续执行主进程
[process.join() for process in processes]
# 执行主进程
print("任务执行结束.....")

在这里插入图片描述

案例
import threading
import multiprocessing
from mytimeit import timeit
class JobProcess(multiprocessing.Process):
 # 重写Process的构造方法, 获取新的属性
    def __init__(self,li):
        super(JobProcess,self).__init__()
        self.li = li
   # 重写run方法, 将执行的任务放在里面即可
    def run(self):
        for item in self.li:
            sum(item)
class JobThread(threading.Thread):
    def __init__(self,li):
        super(JobThread,self).__init__()
        self.li = li
    def run(self):
        sum(self.li)
@timeit
def use_multi_process():
 # 1). 开启的进程数有瓶颈, 取决于CPU的个数;
    # 2). 如果处理的数据比较小, 不建议使用多进程, 因为进程的创建和销毁需要时间,
    #     开启的进程数越多,不一定效率越高;;
    # 3). 如果处理的数据量足够大, 0<开启的进程数<cpu个数, 开启的进程数越多, 效率越高;
    lists = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6],
             [2, 3, 4, 5, 6, 7, 8], [2, 3, 4, 5, 6]] * 1000
    processes = []
    # 对于处理的数据进行分片, 每个进程处理一部分任务;
    for i in range(0,len(lists),1000):
        p = JobProcess(lists[i:i+1000])
        processes.append(p)
        p.start()
     # 等待所有的子进程执行结束
    [process.join() for process in processes]
    print("多进程执行结束.....")
@timeit
def use_multi_thread():
    lists = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6],
             [2, 3, 4, 5, 6, 7, 8], [2, 3, 4, 5, 6]] * 1000
    threades = []
    for li in lists:
        t = JobThread(li)
        threades.append(t)
        t.start()
    [thread.join() for thread in threades]
    print("多线程执行结束.....")
if __name__=='__main__':
    use_multi_process()
    use_multi_thread()

在这里插入图片描述

守护进程

守护线程:
setDeamon:
True: 主线程执行结束, 子线程不再继续执行;
Flase:主线程执行结束, 子线程继续执行;

import multiprocessing
import time
def job():
    name = multiprocessing.current_process()
    print("开始运行")
    time.sleep(3)
    print("结束进程")
if __name__=="__main__":
 # 启动一个子进程
    p1 = multiprocessing.Process(target=job,name='use deamon')
    p1.daemon = True
    p1.start()
     # join等待子进程执行1s
    p1.join(1)
    # 主进程执行
    print("程序执行结束")

在这里插入图片描述
当为False时:
在这里插入图片描述

终止进程
import time
import multiprocessing
def job():
    print("start.....")
    time.sleep(1)
    print("end......")
if __name__=='__main__':
    p = multiprocessing.Process(target=job)
    print("Before:",p.is_alive())
    p.start()  # 启动子进程
    print("During:",p.is_alive())
    p.terminate()    # 终止子进程
    print("terminate:",p.is_alive())
    p.join()        #等待子进程彻底终止
    print("joined:",p.is_alive())

在这里插入图片描述

进程之间的通信(生产者消费者模型)
import multiprocessing
import time
from multiprocessing import Queue
class Producer(multiprocessing.Process):
# 往队列里面写内容
    def __init__(self,queue):
        super(Producer,self).__init__()
        self.queue = queue
    def run(self):
        for i in range(100):
            self.queue.put(i)
            time.sleep(0.1)
            print("传递消息,内容为:%s"%(i))
class Consumer(multiprocessing.Process):
# 读取队列里面的内容
    def __init__(self,queue):
        super(Consumer,self).__init__()
        self.queue = queue
    def run(self):
     # 判断队列是否为空, 如果是, 跳出循环, 不会再去从队列获取数据;
        while True:
            time.sleep(0.1)
            print("读取进程传递的消息:%s"%(self.queue.get()))
if __name__=="__main__":
    q = Queue()
    p1 = Producer(q)
    c1 = Consumer(q)
    p1.start()
    c1.start()
    p1.join()
    c1.terminate()
    c1.join()
    print("all done")

在这里插入图片描述

分布式进程
  1. why 分布式进程?
    任务需要处理的数据特别大, 希望多台主机共同处理任务;
  2. how 实现分布式进程?
    multiprocessing.managers子模块里面可以实现将进程分布到多台机器上;
    Master: 管理端, 分配任务给其他主机;
    Worker1: 被管理端, 处理master给予的任务;
    Worker2:被管理端, 处理master给予的任务;
  3. 特别重要的类:
    BaseManager: 提供了不同机器进程之间共享数据的一种方法;
    (重要的点: ip:port)

taskMaster代码:

import random
from queue import Queue
from multiprocessing.managers import BaseManager
# 1. 创建需要的队列
# task_queue存储的是任务需要传递的参数
task_queue = Queue()
# result_queue存储的是任务执行结果
result_queue = Queue()
# 2. 将队列注册到网络上
# 需要将两个队列注册到网络上, 使得其他主机可以访问;
BaseManager.register('get_task_queue',callable=lambda :task_queue)
BaseManager.register('get_result_queue',callable=lambda :result_queue)
# 绑定端口为为4000, 暗号/密钥为cooffee
manager = BaseManager(address=('',4000),authkey=b'cooffee')
# 3. 启动manager, 开始共享队列;
manager.start()
# 4. 通过网络访问共享的Queue对象,
# manager.register: 注册一个队列, 唯一标识'get_task_queue'
# manager.get_task_queue()调用注册, 调用过程中执行的内容为callable的函数;
task = manager.get_task_queue()
result = manager.get_result_queue()
# 5. 开始往队列里面放执行任务需要的数据;
for i in range(100):
    n = random.randint(1,1000)
    task.put(n)
    print("任务列表加入任务:%d"%(n))
    # 6. 从result队列里面读取各个及机器执行的结果;
for j in range(100):
    res = result.get()
    print("队列任务的执行结果:%s"%(res))
# 7. 关闭manager, 取消共享队列;
manager.shutdown()

在这里插入图片描述
taskWorker的代码:

# 1. 连接Master端, 获取共享的队列;
# address写的是master端的ip和共享的端口, authkey与master端保持一致;
from multiprocessing.managers import BaseManager
import time
worker = BaseManager(address=('172.25.254.78',4000),authkey=b'cooffee')
# 2. 注册队列, 获取共享端的队列内容
BaseManager.register('get_task_queue')
BaseManager.register('get_result_queue')
# 3. 去连接
worker.connect()
# 4. 通过网络访问共享的Queue对象,
# manager.register: 注册一个队列, 唯一标识'get_task_queue'
# manager.get_task_queue()调用注册, 调用过程中执行的内容为callable的函数;
task = worker.get_task_queue()
result = worker.get_result_queue()
# 5. 读取管理端共享的任务, 依次执行;
for i in range(50):
    n = task.get()
    print("运行任务%d ** 2:"%(n))
    res = "%d**2=%d"%(n,n**2)
    time.sleep(1)
    # 将运行结果放入reesult队列
    result.put(res)
print("执行结束......")

在这里插入图片描述

进程池

why进程池?
- 如果启动大量子进程, 会消耗时间用来创建和销毁子进程,
- 使用进程池, 不需要启动大量的进程;

  • multiprocessing.Pool:
import multiprocessing
def job(id):
    print("start %d...." %(id))
    print('end %d....'%(id))
 # 创建一个进程池对象
pool = multiprocessing.Pool(5)
# 给进程池的进程分配任务
for i in range(5):
    pool.apply_async(job,args=(i,))
pool.close()
pool.join()
print('success')

在这里插入图片描述
ProcessPoolExecutor:

from concurrent.futures import ProcessPoolExecutor
def job(id):
    print("start %d...." %(id))
    print('end %d....'%(id))
    return id
def method_1():
 第1种方式: submit
    pool =ProcessPoolExecutor(max_workers=4)
    # 分配任务给子进程, 并且返回一个Future对象;
    f1 = pool.submit(job,1)
    f1.done()     # 获取进程是否执行结束;
    f1.result()      # 获取子进程执行的结果
def method_2():
    pool = ProcessPoolExecutor(max_workers=4)
    for res in pool.map(job,range(1,100)):
        print(res)
#method_1()
method_2()

在这里插入图片描述

多进程计算1- 100000之间的素数和

计算1~100000之间所有素数和, 要求如下:

  • 编写函数判断一个数字是否为素数,
  • 使用内置函数sum()统计所有素数和。
  • 对比1: 对比使用多进程和不使用多进程两种方法的速度。
  • 对比2:对比开启4个多进程和开启10个多进程两种方法的速度。
from math import sqrt
import multiprocessing
from mytimeit import timeit
def is_prime_sum(lies):
    li_prime=[]
    for li in lies:
        if li ==1:
            continue
        for items in range(2,int(sqrt(li))+1):
            if li % items ==0:
                break
        else:
            li_prime.append(li)
    sum(li_prime)
@timeit
def no_use_process():
    li_sum=[ i for i in range(1,100001)]
    is_prime_sum(li_sum)

class process(multiprocessing.Process):
    def __init__(self,li_sum):
        super(process,self).__init__()
        self.li_sum=li_sum
    def run(self):
        li_prime = []
        for li in self.li_sum:
            if li == 1:
                continue
            for items in range(2, int(sqrt(li)) + 1):
                if li % items == 0:
                    break
            else:
                li_prime.append(li)
        sum(li_prime)
@timeit
def use_process():
    li_sum = [i for i in range(1, 100001)]
    listes = []
    for i in range(4):
        p = process(li_sum)
        listes.append(p)
        p.start()
    [liste.join() for liste in listes]
if __name__=='__main__':
    no_use_process()
    use_process()

使用4个进程与不使用对比:
在这里插入图片描述
使用10个进程:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值