Java并发编程的艺术:(11) 并发编程实战

生产者和消费者模式

在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序整体处理数据的速度。

生产者和消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通信,而是通过阻塞队列来进行通信,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。

多生产者和多消费者场景

在多核时代,多线程并发处理速度比单线程处理速度更快,所以可以使用多个线程来生产数据,同样可以使用多个消费线程来消费数据。而更复杂的情况是,消费者消费的数据,有可能需要继续处理,于是消费者处理完数据之后,它又要座位生产者把数据放在新的队列里,交给其他消费者继续处理,如下图:在这里插入图片描述
例如生产者 1 负责将所有客户端发送的消息存放在阻塞队列 1 里,消费者 1 从队列里读消息,让后通过消息 ID 进行散列得到 N 个队列中的一个,然后根据编号将消息存放到不同的队列里,每个阻塞队列会分配一个线程来消费阻塞队列里的数据。如果消费者 2 无法消费消息,就将消息再抛回到阻塞队列 1 中,交给其他消费者处理。

线程池与生产消费者模式

Java 中的线程池类其实就是一种生产者和消费者模式的实现方式,并且实现方式非常高明。生产者将任务丢给线程池,线程池创建线程并处理任务,如果将要运行的任务数大雨线程池的基本线程数就把任务扔到阻塞队列里,这种做法比只使用一个阻塞队列来实现生产者和消费者模式显然要高明很多,因为消费者能够处理直接就处理掉了,这样速度更快,而生产者先存,消费者再取这种方式显然慢一些。

线上问题定位

有时候,有很多问题只有在线上或者预发环境才能发现,而线上又不能调试代码,所以线上定位就只能看日志、系统状态和 dump 线程。

  1. 在 Linux 命令行下使用 TOP 命令查看每个进程的情况,显示如下:在这里插入图片描述
  2. 再使用 top 的交互命令数字 1 查看每个 CPU 的性能数据。
  3. 使用 top 的交互命令 H 查看每个线程的性能信息,在这里可能出现 3 种情况。
  • 第一种情况,某个线程 CPU 利用率一直是 100%,则说明是这个线程有可能有死循环,需要记下这个 PID;
  • 第二种情况,某个线程一直在 TOP 10 的位置,说明这个线程可能有性能问题;
  • 第三种情况,CPU 利用率高的几个线程在不停变化,说明并不是由某一个线程导致 CPU 偏高。

异步任务池

Java 中的线程池设计得非常巧妙,可以高效并发执行多个任务,但是在某些场景下需要对线程池进行扩展才能更好地服务于系统。例如,如果一个任务扔进线程池之后,运行线程池的程序重启了,那么线程池的任务就会丢失。另外,线程池只能处理本机的任务,在集群环境下不能有效地调度所有机器的任务。所以,需要结合线程池开发一个异步任务处理池。如下图:
在这里插入图片描述

任务池的主要处理流程是,每台机器会启动一个任务池,每个任务池里有多个线程池,当某台机器将一个任务交给任务池后,任务池会先将这个任务保存到数据中,然后某台机器上的任务池会从数据库中获取待执行的任务,再执行这个任务。

每个任务有几种状态,分别是创建、执行中、重试、挂起、中止和执行完成。

  • 创建:提交给任务池之后的状态。
  • 执行中:任务池从数据库中拿到任务执行时的状态。
  • 重试:当执行任务时出现错误,程序显式地告诉任务池这个任务需要重试,并设置下一次执行时间。
  • 挂起:当一个任务的执行依赖于其他任务完成时,可以将这个任务挂起,当收到消息后,再开始执行。
  • 中止:任务执行失败,让任务池停止执行这个任务,并设置错误消息告诉调用端。
  • 执行完成:任务执行结束。

任务池的任务隔离。 异步任务有很多种类型,比如抓取网页任务、同步数据任务等,不同类型的任务优先级不一样,但是系统资源是有限的,如果低优先级的任务非常多,高优先级的任务就可能得不到执行,所以必须对任务进行隔离执行。使用不同的线程池处理不同的任务,或者不同的线程池处理不同优先级的任务,如果任务类型非常少,建议用任务类型来隔离,如果任务类型非常多,比如几十个,则可以采用优先级的方式进行隔离。

任务池的重试策略。 根据不同的任务类型设置不同的重试策略,有的任务对实时性要求高,那么每次的重试间隔就会非常短,如果对实时行要求不高,可以采用默认的重试策略,重试间隔随着次数的增加,时间不断增常,比如几秒、几分钟到几小时。每个任务类型可以设置执行该任务类型线程池的最小和最大线程数、最大重试数。

使用任务池的注意事项。 任务必须无状态:任务不能再执行任务的机器中保存数据,比如某个任务时处理上传的文件,任务的属性里有文件的上传路径,如果文件上传到机器 1 ,机器 2 获取到了任务则会处理失败,所以上传的文件必须存在其他的集群里,比如 OSS 或 SFTP。

异步任务的属性。 包括任务名称、下次执行时间、已执行次数、任务类型、任务优先级和执行时的报错信息(方便快速定位问题)。

参考

  • 《Java 并发编程的艺术》
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值