Hadoop 学习总结

最新推荐文章于 2021-05-21 11:21:00 发布

coo_9you

最新推荐文章于 2021-05-21 11:21:00 发布

阅读量586

点赞数

分类专栏：大数据hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coo_9you/article/details/22927143

版权

大数据hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

NameNode:

server:ClientProtocol

serviceRpcServer: DatanodeProtocol、NamenodeProtocol

DataNode:

ipcServer: InterDataNodeProtocol / ClientDataNodeProtocol

JobTracker :

interTrackerServer : InterTrackerProtocol / JobSubmissionProtocol

TaskTracker :

taskReportServer : TaskUmbilicalProtocol

-Dhadoop.log.dir=/home/shengbao/hadoop/log 指定JVM系统属性hadoop.log.dir(本地文件系统日志目录)

简介

Hadoop 的可靠性 ---因为Hadoop假设计算元素和存储会出现异常，因为它维护多个工作数据副本，在失败时候可以对失败的节点重新分布处理

Hadoop 的高效性 ---在MapReuce的思想下，Hadoop 是并行工作的，以加快任务处理速度

Hadoop 的可扩展 ---依赖于部署Hadoop 软件框架计算集群的规模，Hadoop的运算是可扩展的，具有处理PB级别的能力

Hadoop的组成

Hadoop Core 是Hadoop 的核心，提供了一个分布式文件系统（HDFS) ,并支持MapReduce分布式计算框架

Hbase 构造在Hadoop Core 之上，提供一个可扩展、分布式的数据库系统

ZooKeeper 是一个高可用、高可靠的协同工作系统、分布式程序可以用ZooKeeper保存并更新关键共享状态

Common 包括FileSystem 、RPC 和串行库

Avro 用于数据序列化

MapReduce 大规模数据集的并行运算

HDFS 分布式文件系统，检测盒快速回复硬件故障、流式的数据访问、简化一致性模型、通信协议TCP/IP

Chukwa

Pig

Hive

Sqoop

Job 客户端需要执行的一个工作单位，包括输入数据、MapReduce程序和配置信息

源代码目录结构:

hadoop-common-project

--hadoop-annotations

--hadoop-auth

-- *hadoop-common

hadoop-hdfs-project

-- *hadoop-hdfs

-- hadoophdfs-httpfs

hadoop-mapreduce-project

-- bin/conf

-- hadoop-mapreduce-client

--hadoop-mapreduce-client-app

-- *hadoop-mapreduce-client-common

-- *hadoop-mapreduce-client-core

-- hadoop-mapreduce-client-hs

-- hadoop-mapreduce-client-jobclient

-- hadoop-mapreduct-client-shuffle

hadoop-yarn-project

--hadoop-yarn

-- bin/conf

-- *hadoop-yarn-api

-- *hadoop-yarn- common

-- hadoop-yarn-server

-- *hadoop-yarn-server-common

-- *hadoop-yarn-server-nodemanager

-- hadoop-yarn-server-web-proxy

-- *hadoop-yarn-server-resourcemanager

-- hadoop-yarn-applications

-- hadoop-yarn-applications-distributedshell

-- hadoop-yarn-applications-unmanaged-am-launcher

-- *hadoop-yarn-client

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 学习总结

NameNode:server:ClientProtocolserviceRpcServer: DatanodeProtocol、NamenodeProtocolDataNode:ipcServer: InterDataNodeProtocol / ClientDataNodeProtocolJobTracker :interTrackerServer : InterT
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。