akka kafka java_Jay Kreps谈基于Apache Kafka和Kafka Streams的分布式流处理

借助 Apache Kafka 和 Kafka Streams 框架可以更好地搭建以流为中心的架构和开发分布式流处理应用程序。Confluent的CEO Jay Kreps在上周举行的 2016响应式峰会 上为我们带来了有关流处理和微服务的 演讲 。

Jay说,人们已经在数据库技术上做了很多研究,但在消息队列上做得并不多。在基于微服务的系统架构里,消息传递可以作为服务的强有力后盾。

他提到了三种编程范式:请求/响应、批处理和流处理,以及这三种范式之间的区别。流处理同时适用于在线和批处理两种场景。流处理并不是更快的MapReduce,而是处理和分析数据的另一种范式。Jay介绍了Kafka的四种有关流处理的 核心API :Producer、Consumer、Connector和Streams。

Kafka Streams是一个Java类库,可以用来构建具有容错能力的分布式流处理应用程序。它支持map、filter、aggregate(count、sum)和join这些方法。

在大会的另一个 演讲 里,来自UC Santa Cruz的 Peter Alvaro 谈到如何为大规模分布式容错系统做自动故障测试。他提到了沿袭驱动故障注入(Lineage-Drive Fault Injection, LDFI )方法,这种方法利用日志跟踪信息来识别冗余计算,有助于测试的进行。

Peter总结了系统故障测试需要具备的四个条件:

真实的问题

真实的系统

思考时间

故障自由

关于这个话题的更多信息,可以在Netflix 博客 上看到。

大会第二天的活动内容包括Jan Machacek带来的“ 从单体到微服务 ”以及Anil Gursel和Akara Sucharitakul带来的“ 使用Akka Streams和Kafka进行回压 ”。

Jan Machacek介绍了如何使用Akka、Scala和Kafka开发一个微服务系统。这个系统还使用了 Apache Cassandra 作为数据存储,还有RabbitMQ,以及在 Apache Spark 里运行的批处理分析代码。他建议我们在开发分布式系统时要有很好的监控和跟踪能力。每个微服务都可能会发布自己的内部API,开发者们要知道如何使用它们。

Anil Gursel和Akara Sucharitakul讲述了他们在PayPal利用 Akka Streams 和Kafka的回压能力来应对突发性负载的经历。他们举了一个Web爬虫的例子,并告诉我们他们是如何利用Kafka的缓冲能力和Akka Streams的回压异步处理能力来应对突发性负载的。

Akka Streams框架提供了纯异步流处理,具有响应式流的特点。他们还讲到了 Squbs ,Squbs是PayPal开发的一个响应式平台,并具有引导启动、生命周期管理能力,可以用于构建松耦合的模块化系统,并为日志和监控提供了集成接口。

感谢冬雨对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值