kafka与SparkStreaming整合

2 篇文章 0 订阅
1 篇文章 0 订阅

1、Receiver模式

  • 接收器模式,必须有一个Task接收数据
  • 接收器模式的话很容易造成丢失数据。如果接收数据的期间,Driver挂掉,那么在Excuter内存中的数据多多少少会丢失一些,
  • WAL机制优化机制,可以将数据存储在Hdfs一份,但一定要设置Checkpoint 持久化 才可以放磁盘 不tm开启放个屁。
    1.6之后这种模式就被移除了

在这里插入图片描述

Direct模式

  • 处理数据就去拿,而不是被动的接收数据
  • Receiver太被动的接收数据了,来一条数据,要么放磁盘要么放内存。
    在这里插入图片描述
  • 图片中的 整合所依赖的API是老版本kafka才有的,新版本有新的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值