-
Hadoop是一套 大数据解决方案 ,包揽了许多技术,使得大数据处理人员能够简单高效地对大型数据集进行分布式处理。 Hadoop主要解决的大规模数据下的离线数据分析问题,可以用于一次写入,多次读取分析,具备较高的处理时延(T+1),其架构核心为MapReduce、HDFS、Yarn,分别为Hadoop提供了分布式计算、 分布式存储 以及分布式资源调度的能力,而基于Hadoop的大数据技术则有 Hive (离线数据分析)、 Spark (实时数据分析)、 HBase (分布式 NoSQL )等。
Hadoop是一套 大数据解决方案 ,包揽了许多技术,使得大数据处理人员能够简单高效地对大型数据集进行分布式处理。 Hadoop主要解决的大规模数据下的离线数据分析问题,可以用于一次写入,多次读取分析,具备较高的处理时延(T+1),其架构核心为MapReduce、HDFS、Yarn,分别为Hadoop提供了分布式计算、 分布式存储 以及分布式资源调度的能力,而基于Hadoop的大数据技术则有 Hive (离线数据分析)、 Spark (实时数据分析)、 HBase (分布式 NoSQL )等。