创建多进程
- windows:进程、线程
- linux:进程、线程(做了进程通信的多进程实现的线程)
- 1:进程之间内存彼此独立
- 父子进程
- 单个独立进程
- multiprocessing:Process
- 北极星:mult
- 一个任务(工作函数)绑定在一个进程
- current_process:当前进程
- 一定要把多进程的放在main
p1 = Process(target=func,name=,args=(),kwargs={})
p1.start() #开启进程
p1.join() #回收进程
p1.name #获取进程名字
p1.pid 获取进程ID之
p1.terminate 直接终止进程
p1.is_alive() 返回进程的存活状态 True/False
p1.exitcode 0代表进程死亡 None代表进程运行
p1.ident 和pid类似
僵尸进程
孤儿进程
多进程通信
Python中任何普通的基础数据类型,都不可以在多进程下通信
- Queue(size):共享队列,阻塞的行为
- 满了不能放:q.put(block=True)
- 空了不能取:q.get(block=True)
- 默认为阻塞行为拿取/存放
- 当修改了拿取的方式为非阻塞,那么数据在取不到或者立即放不进去的时候会直接报错
- queue.Full 满了
- queue.Empty 空的
- q.empty()
- 判断队列是否为空
- q.full()
- 判断队列是否为满
- q.qsize()
- 返回队列数据个数
- 生产者、消费者
- 取出来的数据就取出来了。没了
- Pipe:
- Event:
- Array、Value(不常见):
多进程同步
- Lock:一把锁
- Semaphore:多把锁
死锁
同步:按序执行
异步:乱序,谁有机会谁来
IO密集:疯狂的网络操作,爬虫,文件操作,数据库操作
线程,切换快,彼此共享内存
一个人多个头,只能同时一个头思考问题,IO等待的时候,线程切换
CPU密集:疯狂的计算
Linux:进程,高效利用每一颗头
多个人,多个头
实例1
from multiprocessing import Process,current_process
from time import sleep
import sys
def work():
print('我是子进程:%s,%s' % (current_process().name,current_process().pid))
sys.stdout.flush()
sleep(1)
def main():
'''
如果当前脚本被作为模块导入
'''
print('父进程:%s' % (current_process().name),current_process().pid)
sleep(1)
p1 = Process(target=work,name='子进程一号')
print(dir(p1))
p2 = Process(target=work,name='子进程2号')
p1.start() #开启进程
print(p1.ident)
p2.start() #
p1.join() #子进程的回收
print(p1.ident)
p2.join() #子进程的回收
if __name__ == '__main__':
main()
实例二
from multiprocessing import Process,Queue,current_process
from time import sleep
import sys
def product(q,sig):
#某个进程生产数据
for var in range(16):
sig.put(True) #每次生产,都放一个True
#CPU说了算
q.put(var)
sleep(1)
else:
sig.put(False)
#多个消费者
def custom(q,sig):
#这个进程消费数据
while True:
if sig.get(): #代表还有数据要生产
i = q.get() #非阻塞
print('%s进程取到的数据:%s' % (current_process().name,i))
sys.stdout.flush()
else: #没有数据要生产了
print('子进程结束,数据生产完毕')
sig.put(False)
break
def main():
q = Queue(4) #共享队列
sig = Queue(1)
p1 = Process(target=product,args=(q,sig))
p2 = Process(target=custom,args=(q,sig))
p3 = Process(target=custom,args=(q,sig))
p1.start()
p2.start()
p3.start()
p1.join()
p3.join()
p2.join()
print('------------')
#urlopen()
#requests.get()
if __name__ == '__main__':
main()