KeyarchOS安装Hadoop3.3.1

1 概述

浪潮信息KOS是浪潮信息基于Linux Kernel、OpenAnolis等开源技术自主研发的一款服务器操作系统,支持x86、ARM等主流架构处理器,性能和稳定性居于行业领先地位,具备成熟的 CentOS 迁移和替换能力,可满足云计算、大数据、分布式存储、人工智能、边缘计算等应用场景需求。

Hadoop 是一个开源的分布式计算和存储框架,由 Apache 基金会开发和维护。Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。Hadoop 使用 Java 开发,所以可以在多种不同硬件平台的计算机上部署和使用。其核心部件包括分布式文件系统 (Hadoop DFS,HDFS) 和 MapReduce。详细介绍见官网链接https://hadoop.apache.org/

2 安装准备

2.1 操作系统环境

版本信息:KeyarchOS 5.8sp1

硬件平台:X86_64

2.2 Hadoop版本

Hadoop-3.3.1

https://hadoop.apache.org/

生产厂商:Apache软件基金会(ApacheSoftwareFoundation)

3 安装

3.1 安装Java

JDK1.8(已经在KOS AppSteam仓库发布),可以通过yum install直接安装。

yum install java

3.2 安装Hadoop

1、下载安装包后解压后进入安装目录

tar zxvf hadoop-3.3.1.tar.gz

3.3 创建密钥

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 0600 ~/.ssh/authorized_keys

3.4 配置Hadoop

1、配置core-site.xml

2、配置hdfs-site.xml

3、配置hadoop-env.sh

4、格式化文件系统

bin/hdfs namenode -format

4 运行Hadoop

4.1 启动dfs进程

sbin/start-dfs.sh

4.2 启动yarn进程

sbin/start-yarn.sh

4.3 查看进程

jps

4.4 登录web端

浏览器访问http://localhost:9870/dfshealth.html

4.5 数据测试

1、创建/user/<username>目录

bin/hdfs dfs -mkdir -p /user/root

2、创建input目录并把数据拷贝进去

bin/hdfs dfs -mkdir input

bin/hdfs dfs -put etc/hadoop/*.xml input

3、用Hadoop自带的测试jar包进行测试

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar grep input output 'dfs[a-z.]+'

4、查看运行结果

bin/hdfs dfs -cat output/*

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值