自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 Hadoop 系列(八)—— 基于 ZooKeeper 搭建 Hadoop 高可用集群

一、高可用简介Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFS NameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂,故下面先进行讲解:1.1 高可用整体架构HDFS 高可用架构如下:图片引用自:https://www.edurek...

2019-09-17 13:04:00 270

转载 Hadoop 系列(七)—— HDFS Java API

一、 简介想要使用 HDFS API,需要导入依赖 hadoop-client。如果是 CDH 版本的 Hadoop,还需要额外指明其仓库地址:<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://...

2019-09-17 13:02:40 120

转载 Hadoop 系列(六)—— HDFS 常用 Shell 命令

1. 显示当前目录结构# 显示当前目录结构hadoop fs -ls <path># 递归显示当前目录结构hadoop fs -ls -R <path># 显示根目录下内容hadoop fs -ls /2. 创建目录# 创建目录hadoop fs -mkdir <path> # 递归创建目录hadoop fs -mkdir -p ...

2019-09-17 13:01:32 288

转载 Hadoop 系列(五)—— Hadoop 集群环境搭建

一、集群规划这里搭建一个 3 节点的 Hadoop 集群,其中三台主机均部署 DataNode 和 NodeManager 服务,但只有 hadoop001 上部署 NameNode 和 ResourceManager 服务。二、前置条件Hadoop 的运行依赖 JDK,需要预先安装。其安装步骤单独整理至:Linux 下 JDK 的安装三、配置免密登录3.1 生成密匙在每台主机...

2019-09-16 08:55:44 128

转载 Hadoop 系列(四)—— Hadoop 开发环境搭建

一、前置条件Hadoop 的运行依赖 JDK,需要预先安装,安装步骤见:Linux 下 JDK 的安装二、配置免密登录Hadoop 组件之间需要基于 SSH 进行通讯。2.1 配置映射配置 ip 地址和主机名映射:vim /etc/hosts# 文件末尾增加192.168.43.202 hadoop0012.2 生成公私钥执行下面命令行生成公匙和私匙:ssh-key...

2019-09-16 08:54:49 231

转载 Hadoop 系列(三)—— 分布式计算框架 MapReduce

一、MapReduce概述Hadoop MapReduce 是一个分布式计算框架,用于编写批处理应用程序。编写好的程序可以提交到 Hadoop 集群上用于并行处理大规模的数据集。MapReduce 作业通过将输入的数据集拆分为独立的块,这些块由 map 以并行的方式处理,框架对 map 的输出进行排序,然后输入到 reduce 中。MapReduce 框架专门用于 &lt;key,va...

2019-09-13 17:50:47 130

转载 Hadoop 系列(二)—— 集群资源管理器 YARN

一、hadoop yarn 简介Apache YARN (Yet Another Resource Negotiator) 是 hadoop 2.0 引入的集群资源管理系统。用户可以将各种服务框架部署在 YARN 上,由 YARN 进行统一地管理和资源分配。<div align="center"> <img width="600px" src="https://raw.g...

2019-09-13 17:48:20 336

转载 Hadoop 系列(一)—— 分布式文件系统 HDFS

一、介绍HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。二、HDFS 设计原理2.1 HDFS 架构HDFS 遵循主/从架构,由单个 NameNode(NN) 和多个 DataNode(DN) 组成:NameNode : 负责执行有关 文件系统命名空间 的操作,例如打...

2019-09-11 14:46:25 275

转载 基于 ZooKeeper 搭建 Hadoop 高可用集群

一、高可用简介Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFS NameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂,故下面先进行讲解:1.1 高可用整体架构HDFS 高可用架构如下:图片引用自:https://www.edurek...

2019-06-20 10:53:26 138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除