1.概述 1. 概述 Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性: • 高可靠性 • 高效性 • 高可扩展性 • 高容错性 • 成本低 • 运行在Linux平台上 • 支持多种编程语言 2. Hadoop不同版本 2.Hadoop项目结构 Tez:构建有向无环图。 HBASE:支持随机读写,面向列存储。 3.Hadoop的安装与使用