大数据
伊布拉西莫
思想上的强者,行动上的弱者。
展开
-
初识Storm
从零开始学Storm apache_storm_tutorial Storm简介 什么是Storm Storm是一个免费开源的分布式实时计算系统,主要使用Clojure与Java语言编写。 Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有最高的摄取率。 Apache Storm vs Hadoop 基本上Storm和Hadoop都是用于分析...原创 2018-08-28 21:44:50 · 196 阅读 · 0 评论 -
kafka简介
Kafka 是一款开源的、轻量级的 、分布式、可分区和具有复制备份的 C Replicated )、基于ZooKeeper 协调管理的分布式流平台的功能强大的消息系统 。 Kafka 定位就是一个分布式流处理平台。作为一个流式处理平台,必须满足以下三个关键特性: 能够允许发布和订阅流数据。 存储流数据时提供相应的容错机制。 当流数据到达时能被及时处理。 kafka结构 消息生产者...原创 2018-08-28 21:45:48 · 548 阅读 · 0 评论