最牛入门资源置顶:TutorialsPoint 一看即懂入门教程
学习过程中,遇到很多困惑,在不同的资源渠道看到一些好的文章,汇总至此。后期针对自己的业务场景需求,再做梳理总结。
总结记录
1. Kafka 一句话简介:基于发布订阅模式 pub-sub 的消息中间件
Apache Kafka is publish-subscribe based fault tolerant messaging system.
2. Flume 一句话简介:从多种数据源采集数据到 Hadoop
解决痛点在于采集传输来自多样化数据源的大量数据到一个中心化的数据存储中。针对Hadoop 提供了最好的优化和支持。
Flume is a standard, simple, robust, flexible, and extensible tool for data ingestion from various data producers (webservers) into Hadoop.
下面这个表格列举了 Flume 里面“多样化”这三个字到底多么强大!