Kafka是由Linkedin开发的一个分布式的消息队列系统(Message Queue),开发的主要初衷目标是构建一个用来处理海量日志,用户行为和网站运营统计等的数据处理框架。在结合了数据挖掘,行为分析,运营监控等需求的情况下,需要能够满足各种实时在线和批量离线处理应用场合对低延迟和批量吞吐性能的要求。简言之,kafka试图提供一个同时满足在线和离线处理海量数据的消息派发系统。
几篇介绍较为详细的文章:
(1)http://www.aboutyun.com/thread-12882-1-1.html
(2)http://www.cnblogs.com/likehua/p/3999538.html
(3)http://www.infoq.com/cn/articles/kafka-analysis-part-1/
(4)http://blog.csdn.net/colorant/article/details/12081909