《Hadoop大数据技术》实验报告(1)Hadoop的伪分布式安装和配置

《Hadoop大数据技术》实验报告(1)

班级 学号 姓名

Hadoop的伪分布式安装和配置
一、实验目的
1、理解Hadoop伪分布式的安装过程;
2、学会JDK的安装和SSH免密码配置;
3、学会Hadoop的伪分布式安装和配置。
二、实验内容
在linux平台中安装Hadoop,包括JDK安装、SSH免密码配置和伪分布式安装。
三、实验过程
(一)、Java JDK的安装
1、将JDK解压到“/software”目录下。

tar  –zxvf  jdk-8u161-linux-x64.tar.gz

在这里插入图片描述
在这里插入图片描述

2、在/etc/profile中配置JAVA_HOME和PATH环境变量。
查看jdk所在绝对路径
进入配置Vim/etc/profile
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3、使环境变量生效并检查

source/etc/profile 

在这里插入图片描述

(二)、SSH免密码配置
1.先进入到ssh目录,命令如下:

cd~/.ssh/

在这里插入图片描述

2.利用 ssh-keygent 生成(非对称加密)密钥

ssh-keygen -t rsa

在这里插入图片描述

3.将密钥加入到授权中

cat ./id_rsa.pub >> ./authorized_keys

在这里插入图片描述

4.执行 「ssh localhost」命令,即可免密登录

在这里插入图片描述

(三)、hadoop的伪分布式安装和配置
1.下载好了的hadoop包解压
进入目标目录:cd software
解压tar -zxvf hadoop -3.2.0.tar.gz
在这里插入图片描述

2.将Hadoop文件名改变便于后期环境配置
在这里插入图片描述

3.配置Hadoop环境变量

Vim /etc/profile

刷新变量source /etc/profile
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.配置hadoop的配置文件
1)cd $HADOOP_HOME/etc/Hadoop

vim hadoop-env.sh 

在这里插入图片描述
在这里插入图片描述

  1. vim core-site.xml
    在这里插入图片描述
    在这里插入图片描述

3)vim hdfs-site.xml
在这里插入图片描述
在这里插入图片描述

5.完成配置执行 NameNode 的格式化:

cd /home/hadoop/software/hadoop
./bin/hdfs namenode -format

在这里插入图片描述

6.试运行Hadoop
1)开启 NameNode 和 DataNode 守护进程。

cd /home/hadoop/software/hadoop
./sbin/start-dfs.sh

#start-dfs.sh是个完整的可执行文件,中间没有空格
在这里插入图片描述

2)出现错误,解决方案

cd /home/hadoop/software/Hadoop
vim hadoop-env.sh

添加

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

在这里插入图片描述

4) 错误WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable

vim ~/.bashrc
export JAVA_LIBRARY_PATH=/usr/local/hadoop/lib/native
source ~/.bashrc

在这里插入图片描述

3)错误Permanently added (ECDSA) to the list of known hosts

vim etc/ssh/ssh_config

#StrictHostKeyChecking ask去掉注释,并改为no
在这里插入图片描述
在这里插入图片描述

7.验证 Hadoop 启动完成后,可以通过命令 jps 来判断是否成功启动
在这里插入图片描述

8.关闭 Hadoop

./sbin/stop-dfs.sh

在这里插入图片描述

  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Hadoop大数据技术是一种开源的分布式计算框架,它能够处理大规模数据集并提供高性能、可伸缩和可靠性的数据处理能力。 Hadoop的核心组件包括Hadoop分布式文件系统(HDFS)和Hadoop分布式计算框架(MapReduce)。HDFS是一个分布式文件系统,可以将大数据集存储在多台计算机上,并提供高容错性和高可用性。MapReduce是一种分布式计算模型,可以将大规模数据集分割成小块,分发给集群中的多个计算节点进行并行处理,最后将结果合并返回。 除了核心组件之外,Hadoop还提供了一些其他工具和组件,如YARN(资源管理系统)、HBase(分布式数据库)、Hive(数据仓库和查询语言)、Pig(数据分析工具)等,这些工具和组件可以与Hadoop一起使用,提供更多丰富的功能和更灵活的数据处理方式。 Hadoop大数据技术的优势主要体现在以下几个方面: 1. 可扩展性:Hadoop能够通过增加计算节点来处理更大规模的数据集,从而实现高性能的数据处理能力。 2. 容错性:Hadoop将数据复制到不同的计算节点上,即使某个节点出现故障,数据依然可以恢复和访问。 3. 成本效益:Hadoop使用廉价的硬件来构建集群,相比传统的大型服务器,成本更低。 4. 处理速度快:由于使用分布式计算模型,Hadoop可以在短时间内处理大规模数据集,提供高速的数据处理能力。 5. 灵活性:Hadoop提供了各种工具和组件,使得开发人员可以根据自己的需求选择最合适的方式来处理数据。 总的来说,Hadoop大数据技术是一个非常强大的数据处理工具,可以帮助企业处理和分析大规模的数据,从而提供更准确、更全面的数据分析和决策支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长浪破风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值