- Apache Hadoop包括Hadoop Distributed File System (HDFS)、MapReduce框架和通用的实用工具,是一种适用于数据密集型应用的软件框架,可用于开发分布式计算环境
- Pig是用于Hadoop的一种高级编程语言和运行时环境
- Jaql是基于JavaScript Object Notation (JSON)的一种高级查询语言,也支持SQL
- Hive是一种数据仓库基础架构,设计用于支持批量查询和分析Hadoop管理的文件
- HBase是一种以列为主的数据存储环境,设计用于支持Hadoop中的稀疏填充的大型表格
- Flume是一种用来数据收集并将其加载到Hadoop中的工具
- Lucene是一种文本搜索和索引技术
- Avro是一种数据序列化技术
- ZooKeeper是分布式应用程序的一种协作服务
- Oozie是工作流/作业编排技术
hadoop
最新推荐文章于 2024-09-14 22:42:29 发布