Hadoop学习笔记(一):HDFS分布式文件系统(从环境搭建到Java API)
一、Hadoop简介Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件。Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,从而在计算机集群之上提供高可用性服务,每个计算机都可能容易...
原创
2019-01-18 20:39:38 ·
746 阅读 ·
0 评论