Hadoop:对大量数据进行分布式处理的软件框架。
特点:①可伸缩:节点可增加可减少以适应服务器规模。
②可靠性:会进行数据副本的存储。
③高效:并行处理加快速度。
④成本低。
核心:①Hadoop Common:公共基础设施。
②Hadoop HDFS:可扩展、容错、高性能分布式文件系统。
1.高频容错性:数据自动保存副本。
2.适合高吞吐量数据访问。
3.一次写入,多次读取。写入后不能修改。
③Hadoop mapReduce:分布式计算框架。用于大规模数据并行运算
Hadoop:对大量数据进行分布式处理的软件框架。
特点:①可伸缩:节点可增加可减少以适应服务器规模。
②可靠性:会进行数据副本的存储。
③高效:并行处理加快速度。
④成本低。
核心:①Hadoop Common:公共基础设施。
②Hadoop HDFS:可扩展、容错、高性能分布式文件系统。
1.高频容错性:数据自动保存副本。
2.适合高吞吐量数据访问。
3.一次写入,多次读取。写入后不能修改。
③Hadoop mapReduce:分布式计算框架。用于大规模数据并行运算