要点如下
1.日志的存储分区追加方式
2.offSet,
3.生产者和消费者都能选择分区去发送
4.消息的传递有两种方式----队列和发布订阅的方式
5.为了保证在传输中的整体顺序,分区数设置为1,此时的消费者就是一个了;如果分区多,kafka异步传输消息到每个分区,就难保证整体的完整有序。
使用场景
1.kafka作为消息代理
除了解藕、缓存外,还有高吞吐量和容错的功能。但是高吞吐总是有一点限制
2.网页活动追踪
追踪用户浏览的pv,用户行为活动(如点击),等等具有高体积的数据
3.监控数据管道
4.收集日志数据到中心。比srcibe和Flume性能更好的收集日志数据到中心,因为其低延迟和高的持久保证
5.流数据处理。将数据转化为kafka为了进一步的消费,使用kafka