按照文档原文大概取了一部分摘要
Kafka是什么
Kafka是分布式,基于分区,可复制的Commit Log服务,功能类似Messaging系统(MQ),但是它的设计是独特的
它的特点是,轻量级,高性能(按照 这篇blog里做的Benchmark , 3台便宜的机器组成的集群,写入速度可以到200万 / sec)
Kafka几个核心概念,后面再逐步挖掘每个概念
1)Topic2)Log
3)Distribution
4)Producer
5)Consumer
Kafka主要应用场景:
1) Messaging
类似ActiveMQ和RabbitMQ
2) Website Activity Tracking
这个应该是最初Kafka设计用来做的事情,比如跟踪用户点击,搜索等行为数据的搜集。
3) Metrics
Operational monitoring data, 用来可以做分布式环境的统计等
4) Log Aggregation
分布式环境下Log文件的统一管理
5) Stream processing
类似pipeline模式
6) Event Sourcing
Martin Fowler的EAP
http://martinfowler.com/eaaDev/EventSourcing.html
7) Commit Log