云计算技术 实验三 安装Hadoop系统并熟悉hadoop命令

参考资料为:

教材代码-林子雨编著《大数据基础编程、实验和案例教程(第2版)》教材所有章节代码_厦大数据库实验室博客

1.实验学时

4学时

2.实验目的

  • 熟悉Hadoop系统的安装
  • 掌握Hadoop系统的两种安装方式
  • 掌握Hadoop系统的基本命令

3.实验内容

  • 安装虚拟机和Linux环境。

虚拟机安装完毕:

已经改变虚拟机网络连接方式为桥接网络,使用手机热点连接计算机

环境为Linux系统

(二)参照实验指南的内容安装Hadoop系统,安装单机模式。

按照书上之前的配置,已经安装hadoop.

 

按照命令查看hadoop的例子

书上的例子统计对应的正则表达式.

书上的例子统计对应的正则表达式.

由此获得各个数字的统计数量。

(三)参照实验指南的内容安装Hadoop系统,安装伪分布式模式。

使用vim命令修改core-site.xml文件:

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

使用vim命令修改hdfs=site.xml文件:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

之后执行名称节点格式化:

成功安装伪分布模式。

(四)运行伪分布式模式,在网络页面上展示HDFS的信息。

虚拟机上网查看是否运行

 

 

发现运行成功。

(五)运行伪分布式模式的实例子。

复制文件:

复制成功之后的输出表:

运行hadoop自带的grep程序:

 

运行结果:

关闭hadoop:

4.思考题

(一)安装Hadoop的时候遇到什么问题?采用什么方法解决的?

1.安装的时候发现虚拟机无法上网,后面在电脑的网络共享中心配置虚拟机的.xof文件重装,然后使用手机热点连接虚拟机,在虚拟机的网络配置中手动增加主机的网络ip地址连接。

2.在不用使用hadoop时,需要自己手动打出命令stop-dfs.sh关闭hadoop,不然可能数据会丢失。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

stearm210

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值