一、进程池与线程池知识点:
线程不可能无限制的开下去,总要消耗和占用资源
进程池线程池概念:硬件有极限,为了减轻硬件压力,所以有了池的概念
- concurrent.futures模块导入
- 线程池创建(默认线程数=cpu核数*5左右)
- submit提交任务(提交任务的两种方式)
- 异步提交的submit返回值对象
- shutdown关闭池并等待所有任务运行结束
- 对象获取任务返回值
- 进程池的使用,验证进程池在创建的时候里面固定有指定的进程数
- 异步提交回调函数的使用 add.done.callback()
二、进程池与线程池的使用
特点:
开线程与开进程都会消耗资源,开线程消耗的资源比开进程要少
开启了这些池:是为了减缓计算机硬件的压力,避免了计算机硬件崩溃
虽然减轻了计算机硬件的压力,但是在一定程度上降低了程序的效率
开启了这些池,会限制开启的线程数和进程数,从而保证计算机硬件的安全
线程池:
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
import time
pool = ThreadPoolExecutor(5) #创建了一个池子,池子里有20个线程,默认值为cpu核数*5个
def task(n):
print(n,'----------')
time.sleep(2)
return n**2
# 提交任务的方式:
# 同步:提交完任务以后,原地等待任务的返回结果,再继续执行下一步代码
# 异步:提交完任务以后,不等待任务的返回结果,直接执行下一步操作
t_list= []
for i in range(20):
future = pool.submit(task,i) #异步提交任务
# print(future.result()) #此处的future是一个对象, .result()可以拿到返回值 加上这步,变成了同步提交
t_list.append(future)
for p in t_list:
print('返回值:',p.result())
# 此处的输出结果逻辑,前面5个线程从task里出来后,将其的返回值打印出来,
# 然后这五个线程从池子里出来,后面的线程在去竞争池子里的5个份额,如此往复。
print('主')
#shutdown的用法
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
import time
pool = ThreadPoolExecutor(5)
def task(n):
print('hello',n)
time.sleep(2)
return n**2
t_list = []
for i in range(20):
future = pool.submit(task,i)
t_list.append(future)
#加上了shutdown,会导致下面的返回值在终端打印时是最后打印,不会与上述例子一样看起来无序
# pool.shutdown() #关闭池子的进入通道,并且等待池子里所有的任务运行完毕
for p in t_list:
print('>>>:',p.result())
print('主')
进程池
'''
与线程池存在一个大的区别:线程池里的参数,代表最多可以同时进去这个参数的值,
其它的线程需要在池完等着里面结束:进程池也是类似,但是,进程池里的参数是'事先存在的',
无论有多少的进程被创建,使用的都是这里面这些参数的进程,也就是始终是这些池子里的参数帮忙处理任务。
这样做是为了节省资源。
'''
from concurrent.futures import ProcessPoolExecutor
import time,os
pool = ProcessPoolExecutor(5) #进程池里存在5个进程
def task(n):
print('%s say hello!'%n,'该进程的pid是%s'%os.getpid())
time.sleep(2)
return n**2
#回调函数:异步提交之后一旦任务有返回结果,自动交给另外一个去执行
def call_back(m): #此处的参数m是函数task的返回值
print('我拿到了结果%s'%m.result())
if __name__ == '__main__': #需要加上这一步,线程创建可有可无
l_list = []
for i in range(20):
future = pool.submit(task,i).add_done_callback(call_back) #异步提交
#此处task函数的返回结果交给call_back去执行
print('主')
三、协程
- 进程:资源单位
- 线程:执行单位
- 协程:单线程下实现并发(能够在多个任务之间切换和保存状态来节省IO),这里注意区分操作系统的切换+保存状态是针对多个线程而言,而我们现在是想在单个线程下自己手动实现操作系统的切换+保存状态的功能
注意协程这个概念完全是程序员自己想出来的东西,它对于操作系统来说根本不存在。操作系统只知道进程和线程。并且需要注意的是并不是单个线程下实现切换+保存状态就能提升效率,因为你可能是没有遇到io也切,那反而会降低效率
再回过头来想之前的socket服务端实现并发的例子,单个线程服务端在建立连接的时候无法去干通信的活,在干通信的时候也无法去干连接的活。这两者肯定都会有IO,如果能够实现通信io了我就去执行建连接任务,建连接io了我就执行通信任务,那其实我们就可以实现单线程下实现并发。
将单个线程的效率提升到最高,多进程下开多线程,多线程下用协程>>> 实现高并发!!!
#串行执行
import time
def func1():
for i in range(10000000):
i + 1
def func2():
for i in range(10000000):
i+1
start = time.time()
func1()
func2()
stop = time.time()
print(stop - start) #2.845162868499756
#基于yield来实现并发执行
import time
def fun1():
while True:
1000000 + 1
yield
def fun2():
g = fun1()
for i in range(1000000):
i + 1
next(g)
start = time.time()
fun2()
stop = time.time()
print(stop - start) #0.33101892471313477
gevent模块:
#yield却不能自动捕获io行为,可以利用gevent模块来实现
#gevent本身识别不了time,sleep等不属于该模块的io操作
from gevent import monkey;monkey.patch_all() #监测所有的IO行为
from gevent import spawn,joinall #jional列表里放置多个对象,实现join效果
import time
def play(name):
print('%s play 1'%name)
time.sleep(5)
print('%s play 2'%name)
def eat(name):
print('%s eat 1'%name)
time.sleep(3)
print('%s eat 2'%name)
start = time.time()
'''
g1=gevent.spawn(func,1,,2,3,x=4,y=5)创建一个协程对象g1,spawn括号内第一个参数是函数名,
如eat,后面可以有多个参数,可以是位置实参或关键字实参,都是传给函数eat的
'''
t1 = spawn(play,'michael')
t2 = spawn(eat,'michael')
joinall([t1,t2])
print('主',time.time() - start)
'''
michael play 1
michael eat 1
michael eat 2
michael play 2
主 5.01228666305542
'''
四、协程实现服务端与客户端通信(服务端单线程下实现并发)
链接和通信都是io密集型操作,我们只需要在这两者之间来回切换就可以实现并发的效果
服务端监测链接和通信任务,客户端起多线程的同时连接服务端
#服务端:
from gevent import monkey;monkey.patch_all()
from gevent import spawn
import socket
def communicate(conn):
while True:
try:
data = conn.recv(1024)
if len(data) == 0:break
print(data.decode('utf-8'))
conn.send(data.upper())
except ConnectionResetError:
break
conn.close()
def server():
server = socket.socket()
server.bind(('127.0.0.1',8030))
server.listen(5)
while True:
conn, addr = server.accept()
spawn(communicate,conn)
if __name__ == '__main__':
s1 = spawn(server)
s1.join()
客户端:
import socket
from threading import Thread,current_thread
def client():
client = socket.socket()
client.connect(('127.0.0.1',8030))
n = 1
while True:
data = '%s %s'%(current_thread().name, n)
n += 1
client.send(data.encode('utf-8'))
info = client.recv(1024)
print(info)
if __name__ == '__main__':
for i in range(500):
t = Thread(target=client)
t.start()
效果:原本服务端需要开启500个线程才能跟500个客户端通信,现在只需要一个线程就可以抗住500个客户端
进程下面开多个线程,线程下面再开多个协程,最大化提升软件的运行效率
IO模型:待续