Hadoop是专门针对大数据处理的一套框架。Hadoop是将同一个表中的数据分成多块保存到多个节点(分布式),而且每一块数据都有多个节点保存(集群),所以集群除了可以并行处理相同的数据,还可以保证数据的稳定性,其中一个节点出现问题数据不会丢失。这里每个节点都不包含一个完整的表的数据,但是一个节点可以保存多个表的数据,数据存储结构图如下
Hadoop对数据的处理是先对每一块的数据找到相应的节点进行处理,然后再对每一个处理的结果进行处理,最后生成最终的结果。
Hadoop是专门针对大数据处理的一套框架。Hadoop是将同一个表中的数据分成多块保存到多个节点(分布式),而且每一块数据都有多个节点保存(集群),所以集群除了可以并行处理相同的数据,还可以保证数据的稳定性,其中一个节点出现问题数据不会丢失。这里每个节点都不包含一个完整的表的数据,但是一个节点可以保存多个表的数据,数据存储结构图如下
Hadoop对数据的处理是先对每一块的数据找到相应的节点进行处理,然后再对每一个处理的结果进行处理,最后生成最终的结果。