Hive:是一个数据仓库,提供大量结构化数据检索; Hbase:列式分布式数据库; Spark:基于内存的分布式计算框架 Sqoop:是传统数据库和hadoop之间数据导入导出的工具 Avro:是hadoop集群部署管理框架