大数据
文章平均质量分 89
HENU-PD
这个作者很懒,什么都没留下…
展开
-
大数据——分布式文件系统HDFS
分布式文件系统(Distributed File System)是一种通过网络连接多台主机并在这些主机上进行分布式文件存储的文件系统,目前被广泛应用的有GFS和HDFS若干主机放在机架上,若干机架通过交换机相连共同构成的一个计算机集群通常可用于分布式文件系统。HDFS原来是Apache Nutch搜索引擎的一部分,后来独立成为一个子项目,并和MapReduce一起成为Hadoop的核心组成部分。原创 2024-06-04 17:02:05 · 792 阅读 · 0 评论 -
大数据处理架构Hadoop(考试版)
Hadoop是java语言开发的,核心是Hadoop分布式文件系统(HDFS)和MapReduce。其中HDFS是针对谷歌文件系统(GFS,详见云计算)的开源实现,MapReduce也是针对谷歌同名MapReduce的开源实现。原创 2024-05-21 15:32:08 · 1091 阅读 · 0 评论