java akka 实战_Akka实战:分散、聚合模式

分散与聚合:简单说就是一个任务需要拆分成多个小任务,每个小任务执行完后再把结果聚合在一起返回。

6ef3a6c6b8554ce14a5f8e930f837faa.png

实例背景

本实例来自一个真实的线上产品,现将其需求简化如下:

传入一个关键词:key,根据key从网上抓取相关新闻

可选传入一个超时参数:duration,设置任务到期时必须反回数据(返回实际已抓取数据)

若超时到返回实际已爬取数据,则任务应继续运行直到所以数据抓取完成,并存库

设计

根据需求,一个简化的分散、聚合模式可以使用两个actor来实现。

NewsTask:接收请求,并设置超时时间

SearchPageTask:执行实际的新闻抓取操作(本实例将使用TimeUnit模拟抓取耗时)

实现

NewsTask

override def metricPreStart(): Unit = {

context.system.scheduler.scheduleOnce(doneDuration, self, TaskDelay)

}

override def metricReceive: Receive = {

case StartFetchNews =>

_receipt = sender()

(0 until NewsTask.TASK_SIZE).foreach { i =>

context.actorOf(SearchPageTask.props(self), "scatter-" + i) ! SearchPage(key)

}

case GetNewsItem(newsItem) =>

_newses ::= newsItem

if (_newses.size == NewsTask.TASK_SIZE) {

logger.debug(s"分散任务,${NewsTask.TASK_SIZE}个已全部完成")

if (_receipt != null) {

_receipt ! NewsResult(key, _newses)

_receipt = null

}

self ! PoisonPill

}

case TaskDelay =>

if (_receipt != null) {

_receipt ! NewsResult(key, _newses)

_receipt = null

}

}

metricPreStart方法中设置定时方法,调用时间为从代码运行开始到doneDuration时间为止。定时被触发时将向当前Actor发送一个TaskDelay消息。

在metricReceive方法中,分别对StartFetchNews、GetNewsItem、TaskDelay三个消息进行操作。

在收到StartFetchNews消息时,actor首先保存发送者actor的引用(结果将返回到此actor)。再根据TASK_SIZE生成相应子任务

GetNewsItem消息的处理中,每收到一个消息就将其添加到_newses列表中。并判断当_newses个数等于TASK_SIZE时(所有子任务已完成)将结果发送给_receipt。

self ! PoisonPill,这句代码停止actor自身。它将把“毒药”发送到NewsTask Actor的接收邮箱队列中。

TaskDelay消息被触发时,将直接返回已完成的新闻_newses。返回数据后并不终止当前还未运行完任务。

SearchPageTask

override def metricReceive: Receive = {

case SearchPage(key) =>

// XXX 模拟抓取新闻时间

TimeUtils.sleep(Random.nextInt(20).seconds)

val item = NewsItem(

"http://newssite/news/" + self.path.name,

"测试新闻" + self.path.name,

self.path.name,

TimeUtils.now().toString,

"内容简介", "新闻正文")

taskRef ! GetNewsItem(item)

context.stop(self)

}

SearchPageTask的代码逻辑就比较易懂了,这里使用sleep来模拟实际抓取新闻时的耗时。生成结果后返回数据给`taskRef`,并终止自己。

执行测试

./sbt

akka-action > testOnly me.yangbajing.akkaaction.scattergather.ScatterGatherTest

总结

这是一个简单的Akka实例,实现了任务分发与结果聚合。提供了一种在指定时间内返回部份有效数据,同时任务继续执行的方式。这种分散、聚合的模式在实际生产中很常用,比如对多种数据源的整合,或某些需要长时间运行同时对返回数据完整性无强制要求的情况等。

MetricActor演示了怎么自定义Actor,并为其提供一些侦测点的方式。以后有时间会写篇详文介绍。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>