15-kafka数据重复

题目:kafka数据重复如何解决


答案:

重复是指发生重试造成的重复
解决kafka数据重复:幂等性 + ack-1 + 事务
(1)设置ack应答级别为-1,分区副本个数大于等于2,ISR应答队列中的最小副本数量大于等于2
(2)开启幂等性
(3)开启事务
(4)如果还存在重复,那就在kafka传送的目的地进行去重:spark、redis或者hive等
注意:事务和幂等性是在kafka0.11版本之后才有,企业常用0.10版本,故可以采用第(1)(4)点进行去重


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值