Hadoop

1.Hadoop是一个由Apache基金会所开发的分布式系统基础架构

2.Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS

HDFS高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

3.Hadoop的框架最核心的设计就是:HDFSMapReduce

HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算

4.Hadoop是一个能够对大量数据进行分布式处理软件框架

5.Hadoop 以一种可靠高效可伸缩的方式进行数据处理。

①Hadoop 是可靠的。因为它假设计算元素和存储会失败,因此它维护多个工作数据副本确保能够针对失败的节点重新分布处理

②Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。

③Hadoop 还是可伸缩的,能够处理 PB 级数据

④此外,Hadoop 依赖于社区服务,因此它的成本比较低,任何人都可以使用。

⑤ Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。

⑥Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。

⑦Hadoop上的应用程序也可以使用其他语言编写,比如 C++。

6.Hadoop 架构:

①最底部是 Hadoop Distributed File System(HDFS),它存储 Hadoop 集群中所有存储节点上的文件。

HDFS(对于本文)的上一层是MapReduce 引擎,该引擎由 JobTrackersTaskTrackers 组成。

7.HDFS:
①对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。但是 HDFS 的架构是基于一组特定的节点构建的。

这是由它自身的特点决定的。这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务。NameNode 可以控制所有文件操作DataNode,它为HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 的一个缺点(单点失败)。

②存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机(DataNode)。这与传统的 RAID 架构大不相同。

块的大小(通常为 64MB)和复制的块数量在创建文件时由客户机决定。

③HDFS 内部的所有通信都基于标准的 TCP/IP 协议。

8.MapReduce:

①Google发现大多数分布式运算可以抽象为MapReduce操作
Map是把输入Input分解成中间的Key/Value对Reduce把Key/Value合成最终输出Output。这两个函数由程序员提供给系统,下层设施把Map和Reduce操作分布在集群上运行,并把结果存储在GFS上。

GFS(Google File System):一个分布式文件系统。隐藏下层负载均衡,冗余复制等细节,对上层程序提供一个统一的文件系统API接口。
BigTable:一个大型的分布式数据库。这个数据库不是关系式的数据库。像它是一个巨大的表格,用来存储结构化的数据

9.MapReduce与Hadoop的比较

①Hadoop是一种分布式数据和计算的框架。

它很擅长存储大量的半结构化的数据集。数据可以随机存放,所以一个磁盘的失败并不会带来数据丢失。Hadoop也非常擅长分布式计算,快速地跨多台机器处理大型数据集合。

②MapReduce是处理大量半结构化数据集合的编程模型。

编程模型是一种处理并结构化特定问题的方式。

③MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值