在hadoop运行几个MapReduce的job,并稍微学点儿hadoop的工作原理,基本上也就理解MapReduce的概念了。
hadoop的核心主要包含:HDFS和MapReduce
HDFS是分布式文件系统,用于分布式存储海量数据。
MapReduce是分布式数据处理模型,本质是并行处理。
集群是一种计算机系统,它通过一组松散继承的计算机软件或硬件连接起来高度紧密地完成计算工作。在某种意义上,他们可以被看做是一台计算机。
Spark
最新推荐文章于 2022-06-17 19:49:15 发布