1. 简介 1.1 大数据的两个核心技术 HDFS(Hadoop Distributed File System)是整个Hadoop平台上两大核心组件之一。HDFS主要是为了解决海量数据的分布式存储问题。 1.2 计算机集群基本架构 每一个竖排就是一个机架,每个