Hadoop
分布式架构,多租户环境,文件系统采用HDFS,有丰富的计算引擎,基于Hadoop的Spark计算框架. 解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括 HDFS,MapReduce等基本组件.
清风的BLOG
专注Linux、Python、自动化、云计算、高可用、数据库。
展开
-
HDFS 原理讲解漫画 之三 --- 容错和副本布局策略
1.容错-读写容错 2. 容错-DATANODE 故障 3. 布局策略 4. The End翻译 2019-04-23 15:44:08 · 371 阅读 · 0 评论 -
HDFS 原理讲解漫画 之二 ---- 读数据和容错
1. 读数据原理 2. 容错-故障类型和故障检测翻译 2019-04-23 15:37:38 · 248 阅读 · 0 评论 -
HDFS 原理讲解漫画 之一 ----系统构成和写数据过程
分布式文件系统比较出名的有HDFS 和 GFS,其中HDFS比较简单一点。 本文是一篇描述非常简洁易懂的漫画形式讲解HDFS的原理。比一般PPT要通俗易懂很多。 三个部分: 客户端、Nameserver(可理解为主控和文件索引,类似Linux的inode)、Datanode(存放实际数据) 以上,client的形式有两种 通过Hadoop提供的api所编写的程序可以和hdfs进行交...翻译 2019-04-23 15:26:32 · 244 阅读 · 0 评论