Apache Flink 是由 Apache 软件基金会开发的开源流处理框架,其核心是用 Java 和 Scala
编写的分布式流数据流引擎。
Flink
以数据并行和流水线方式执行任意流数据程序,
Flink
的
流水线运行时系统可以执行批处理和流处理程序。
Kafka
是由
Apache
软件基金会
开发的一个开源流处理平台,由
Scala
和
Java
编写。
Kafka
是一种高吞吐量的
分布式
发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据 。
Apache KafkaApache Kafka: A Distributed Streaming Platform.
https://kafka.apache.org/
![](https://i-blog.csdnimg.cn/blog_migrate/3e3abad46f7db92fcbd5ff8151b64b98.gif)
HBase
是一个分布式的、面向列的开源数据库,该技术来源于
Fay Chang
所撰写的
Google
论文
“Bigtable
:一个结构化数据的
分布式存储系统
”
。就像
Bigtable
利用了
Google
文件系
统(
File System
)所提供的分布式数据存储一样,
HBase
在
Hadoop
之上提供了类似于
Bigtable
的能力。
HBase
是
Apache
的
Hadoop
项目的子项目。
HBase
不同于一般的关系
数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是
HBase
基于列的而
不是基于行的模式
。
Apache HBase – Apache HBase™ Home
https://hbase.apache.org/
![](https://i-blog.csdnimg.cn/blog_migrate/9f94e1de59b5a14afa3d2d91eb9980fb.png)
hive
是基于
Hadoop
的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以
存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
hive
数据仓库工具能将结构化
的数据文件映射为一张数据库表,并提供
SQL
查询功能,能将
SQL
语句
转变成
MapReduce
任务来执行
。
Apache Hive
https://hive.apache.org/
![](https://i-blog.csdnimg.cn/blog_migrate/423fdee9808258d954cb69bfd9d44cc2.png)
Elasticsearch
是一个基于
Lucene
的搜索服务器。它提供了一个分布式多用户能力的全文搜
索引擎,基于
RESTful web
接口。
Elasticsearch
是用
Java
语言开发的,并作为
Apache
许
可条款下的开放源码发布,是一种流行的企业级搜索引擎。
Elasticsearch
用于
云计算
中,能
够 达 到 实 时 搜 索 , 稳 定 , 可 靠 , 快 速 , 安 装 使 用 方 便
(
摘 自 百 度 百 科
) 。