最佳线程数的获取:
1、通过用户慢慢递增来进行性能压测,观察QPS(即每秒的响应请求数,也即是最大吞吐能力。),响应时间
2、根据公式计算:服务器端最佳线程数量=((线程等待时间+线程cpu时间)/线程cpu时间) * cpu数量
3、单用户压测,查看CPU的消耗,然后直接乘以百分比,再进行压测,一般这个值的附近应该就是最佳线程数量。
方式 1 :(推荐)
线程的监听:
pools = ThreadPoolExecutor(5)
def testKafkaConsumerMutil():
consumer= KafkaConsumer("Sea",bootstrap_servers = ['192.168.18.129:9092'],
group_id='test0',
auto_offset_reset='earliest',
max_poll_records=100,
consumer_timeout_ms=30000,
session_timeout_ms=30000,
enable_auto_commit=False)for msg inconsumer:
offset=msg.offset
print("offset"+str(offset))
data=json.loads(msg.value)
pools.submit(printt,data)
#监听当前线程池的线程数量
print("qsize"+str(pools._work_queue.qsize()))if pools._work_queue.qsize()>=6:
pass
time.sleep(30)
consumer.commit()
def printt(value):
# print(value)
time.sleep(2)
pass
ThreadPoolExecutor 返回为future(T)
'''Created on 2019年10月11日
@author: sea'''
#-*- coding: utf-8 -*-
from concurrent.futures importThreadPoolExecutorimporttimefrom com.sea.email.MailUtils importsend'''ThreadPoolExecutor中的submit()
Future submit(Callable callable);
Future submit(Runnable var1, T result);
Future> submit(Runnable runnable);'''
print("线程池 ThreadPoolExecutor 的使用")defsayhello(a):print("hello"+a)#time.sleep(1)
return "结果 nihao :"+adef test1():#submit()
pool = ThreadPoolExecutor(3)
submit1= pool.submit(sayhello,("sea")) #方法名 ,参数()如果有多个参数,直接写多个就好,eg : say(a,b)----->pool.submit(say,"aaa","bbb")#submit1 = pool.submit(sayhello,"sea") #方法名 ,参数()
submit2= pool.submit(sayhello,("sea2"))
submit3= pool.submit(sayhello,("sea3"))
submit4= pool.submit(sayhello,("sea4"))print(submit4.result())#打印应返回值 阻塞-直到返回结果
print(submit1.result())print(submit2.result())print(submit3.result())print("over")def test2():#map()
seed=["a","b","c"]
pool= ThreadPoolExecutor(3)
rsultList= pool.map(sayhello,seed)#返回值为list 结果集
for result inrsultList:print(result)#打印应返回值
print("over")#with ThreadPoolExecutor(3) as executor1:#executor1.map(sayhello,seed)
if __name__ == '__main__':#test1()
test2()
concurrent.futures.ThreadPoolExecutor,在提交任务的时候,有两种方式,一种是submit()函数,另一种是map()函数,两者的主要区别在于:
2.1、map可以保证输出的顺序, submit输出的顺序是乱的
2.2、如果你要提交的任务的函数是一样的,就可以简化成map。但是假如提交的任务函数是不一样的,或者执行的过程之可能出现异常(使用map执行过程中发现问题会直接抛出错误)就要用到submit()
2.3、submit和map的参数是不同的,submit每次都需要提交一个目标函数和对应的参数,map只需要提交一次目标函数,目标函数的参数放在一个迭代器(列表,字典)里就可以。
3.现在?
这里要考虑一个问题,以上两种线程池的实现都是封装好的,任务只能在线程池初始化的时候添加一次,那么,假设我现在有这样一个需求,需要在线程池运行时,再往里面添加新的任务(注意,是新任务,不是新线程),那么要怎么办?
方式2 :python3的vthread库
可以试试python3的vthread库importvthread
@vthread.pool(6)defsome(a,b,c):import time;time.sleep(1)print(a+b+c)for i in range(10):
some(i,i,i)
分组线程池importvthread
@vthread.pool(6)defsome1(a,b,c):import time;time.sleep(1)print("some1",a+b+c)
@vthread.pool(3,1)defsome2(a,b,c):import time;time.sleep(1)print("some2",a*b*c)for i in range(10):
some1(i,i,i)
some2(i,i,i)
加锁或其他操作,help()一下基本就能看懂。
方式3 :(比较老)
使用threadpool模块 具体使用方式如下:
#! /usr/bin/env python#-*- coding: utf-8 -*-
importthreadpoolimporttimedefsayhello (a):print("hello:"+a)
time.sleep(2)defmain():globalresult
seed=["a","b","c"]
start=time.time()
task_pool=threadpool.ThreadPool(5)
requests=threadpool.makeRequests(sayhello,seed)for req inrequests:
task_pool.putRequest(req)
task_pool.wait()
end=time.time()
time_m= end-startprint("time:"+str(time_m))
start1=time.time()for each inseed:
sayhello(each)
end1=time.time()print("time1:"+str(end1-start1))if __name__ == '__main__':
main()