kafka streaming流数据处理遇到的问题实战总结系列【持续更新】

方案设计

  1. 如何结合业务要求对流数据处理方案进行选型(mq选型,流数据处理引擎选型,数据库选型。。)
  2. 数据丢失的可能性分析
  3. 怎么实现数据精准一致性exactly-once
  4. lamda架构的实现

mq

  1. kafka偏移量两种提交方式,三种auto.offset.reset方式的含义和演示(包含代码)
  2. kafka offset的三种存储方式(hbase,zookeeper,kafka自身)
  3. 如何删除kafka话题数据
  4. mq参数如何调优
  5. 生产mq参数如何配置
  6. 如何压测kafka集群性能

流数据引擎

  1. kafka与streaming数据对接
  2. 流处理Spark Streaming如何动态控制消费速率
  3. 流处理Spark Streaming如何调优batch interval参数
  4. 流处理Spark Streaming如何调优gc参数
  5. 流处理Spark Streaming如何实现输出不重复
  6. 如何优雅的关闭streaming任务
  7. 流处理内存持续占用过高问题怎么排查
  8. 如何保证实时任务7x24小时运行的稳定性
  9. 流处理Spark Streaming参数如何调优提供处理性能
  10. 流处理Spark Streaming如何进行task级别的监控
  11. 如何同时启动大量实时任务

存储

  1. streaming数据存储在数据库mysql、hbase、redis

linux

  1. 如何查看Linux系统的缓存由那些大文件构成
  2. Linux系统的“缓存数据”为什么删不掉

运维监控

  1. kafka 监控工具的使用
  2. 启停(zookeeper/kafka/kafka manager/spark/)
  3. 如何对实时任务的延时情况进行监控
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BigDataMLApplication

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值