Hadoop
文章平均质量分 50
努力推石头的西西弗斯
无问西东
展开
-
【长文预警】Hadoop知识体系
Hadoop基础介绍 Hadoop是一个由Apache基金会所开发的可靠的、可扩展的用于分布式计算的分布式系统基础架构和开发开源软件。Apache Hadoop软件库是一个框架,允许使用简单的编程模型在计算机集群中对大规模数据集进行分布式处理。它的目的是从单一的服务器扩展到成千上万的机器,将集群部署在多台机器中,每台机器提供本地计算和存储,并且将存储的数据备份在多个节点,由此提升集群的可用性,而不是通过硬件提升。当一台机器宕机时,其他节点依然可以提供备份数据和计算服务。 Hadoop框架最核心的设计原创 2021-11-16 16:22:53 · 1199 阅读 · 0 评论 -
Google大数据经典论文
《The Google File System 》 2003年 原论文 https://storage.googleapis.com/pub-tools-public-publication-data/pdf/035fc972c796d33122033a0614bc94cff1527999.pdf 中文翻译 https://blog.csdn.net/xuleicsu/article/details/526386 《MapReduce: Simplified Data Processing on Large原创 2021-11-16 16:21:49 · 937 阅读 · 0 评论