[Q&A] 线程池的弊端
Java中的线程池设计得非常巧妙,可以高效并发执行
多个任务,但是在某些场景下需要对线程池进行扩展才能更好地服务于系统。
例如,如果一个任务仍进线程池之后,运行线程池的程序重启了,那么线程池里的任务就会丢失。另外,线程池只能处理本机的任务,在集群环境下不能有效地调度所有机器的任务。所以,需要结合线程池开发一个异步任务处理池
。
[Q&A] 异步任务池设计图
任务池的主要处理流程是,每台机器会启动一个任务池 ,每个任务池里有多个线程池 ,当某台机器将一个任务交给任务池后,任务池会先将这个任务保存到数据库中,然后某台机器上的任务池会从数据库中获取待执行的任务,再执行这个任务。
每个任务有几种状态
# 创建(NEW):提交给任务池之后的状态。
# 执行中(EXECUTING):任务池从数据库中拿到任务执行时的状态。
# 重试(RETRY):当执行任务时出现错误,程序显式地告诉任务池这个任务需要重试,并设置下一次执行时间。
# 挂起(SUSPEND):当一个任务的执行依赖于其他任务完成时,可以将这个任务挂起,当收到消息后,再开始执行。
# 中止(TEMINER):任务执行失败,让任务池停止执行这个任务,并设置错误消息告诉调用端。
# 执行完成(FINISH):任务执行结束。
[Q&A] 任务池的任务隔离
异步任务有很多种类型,比如抓取网页任务、同步数据任务等,不同类型的任务优先级不一样,但是系统资源是有限的,如果低优先级的任务非常多,高优先级的任务就可能得不到执行,所以必须对任务进行隔离执行。使用不同的线程池处理不同的任务,或者不同的线程池处理不同优先级的任务,如果任务类型非常少,建议用任务类型来隔离,如果任务类型非常多,比如几十个,建议采用优先级方式来隔离。
[Q&A] 任务池的重试策略
根据不同的任务类型设置不同的重试策略,有的任务对实时性要求高,那么每次的重试间隔就会非常短,如果对实时性要求不高,可以采用默认的重试策略,重试间隔随着次数的增加,时间不断增长,比如间隔几秒、几分钟到几小时。每个任务类型可以设置执行该任务类型线程池的最小和最大线程数、最大重试次数。
[Q&A] 使用任务池的注意事项
任务必须无状态:任务不能在执行任务的机器中保存数据,比如某个任务是处理上传的文件,任务的属性里有文件的上传路径,如果文件上传到机器1,机器2获取到了任务则会处理失败,所以上传的文件必须存在其他的集群里,比如OSS或SFTP。
[Q&A] 异步任务的属性
包括任务名称
、任务类型
、任务优先级
、下次执行时间
、已执行次数
、报错信息
-----------------------------------------------------------------------------读书笔记摘自 书名:Java并发编程的艺术 作者:方腾飞;魏鹏;程晓明