题目:kafka数据重复如何解决 答案: 重复是指发生重试造成的重复 解决kafka数据重复:幂等性 + ack-1 + 事务 (1)设置ack应答级别为-1,分区副本个数大于等于2,ISR应答队列中的最小副本数量大于等于2 (2)开启幂等性 (3)开启事务 (4)如果还存在重复,那就在kafka传送的目的地进行去重:spark、redis或者hive等 注意:事务和幂等性是在kafka0.11版本之后才有,企业常用0.10版本,故可以采用第(1)(4)点进行去重