Hadoop配置

shiosio

已于 2024-01-30 11:05:21 修改

阅读量44

点赞数

文章标签： big data

于 2023-11-12 17:31:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63327991/article/details/134363188

版权

本文详细介绍了如何在Linux上安装Hadoop，包括解压、配置单机环境变量、运行wordcount示例以及向集群环境扩展，包括配置文件、格式化、启动和管理Hadoop服务。

摘要由CSDN通过智能技术生成

Hadoop分布式系统（单机＋集群）

1.解压缩hadoop

1）先下载hadoop-2.7.3到/opt/soft目录下

2）然后在/usr下新建hadoop目录

# mkdir /usr/hadoop

3）再tar安装hadoop到/usr/hadoop目录下

#在soft目录下，tar -zxvf hadoop2.7.3 -C /usr/hadoop

2.配置单机环境变量

# vi /etc/profile

#source /etc/profile

3.测试

1）创建一个文件夹，里面创建两个记事本，写入一些单词，然后运行自带的wordcount程序

#mkdir mytestin

cd mytestin

vi data1.txt

vi data2.txt

在Hadoop安装目录下

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /usr/hadoop/mytestin /usr/hadoop/mytestout

（# hadoop是命令，jar是程序类型，后面是路径＋jar 然后是输入目录，输出目录）

2）查看运行结果，表示hadoop单机可以运行

#hadoop fs -text /usr/hadoop/mytestout/part-r-00000）

4.配置集群环境变量

1）配置hadoop-env.sh（tips：在hadoop-2.3.7/etc/hadoop/）

（# hadoop运行基础配置）

# The java implementation to use.

2）配置core-site.xml

3）配置yarn-site.xml

4）vi slaves：添加内容masterback,slave1,slave2

5）vi master：添加内容master

6）配置hdfs—site.xml

7）复制模板，并编辑mapred-site.xml

# cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

5.分发（# format）

# scp -r /usr/hadoop root@slave1:/usr

（tips：对master做以下操作：

cd /usr/hadoop/hadoop-2.7.3/

hadoop namenode -format

6.启动Hadoop

1）sbin/start-all.sh

2）jps（# 查看进程）

7.

# 打开浏览器输入：192.168.222.171：9001

http://192.168.222.171:50070可以方便看文件系统，看日志

8.相关命令

1）ls

# hadoop fs -ls /

列出hdfs文件系统根目录下的目录和文件

# hadoop fs -ls -R /

列出hdfs文件系统所有的目录和文件

2）put

#hadoop fs -put <local file> <hdfs file>

hdfs file的父目录一定要存在，否则命令不执行

#hadoop fs -put <local file or dir> ... <hdfs dir>

hdfs dir一定要存在，否则命令不执行

3）get

# hadoop fs -get <hdfs file> <local file or dir>

local file和 hdfs file名字不能相同，否则会提示文件已存在，没有重名的文件会复制到本地

hadoop fs -get <hdfs file or dir> ... <local dir>

4）rm

# hadoop fs -rm <hdfs file>...

hadoop fs -rm -r <hdfs dir>...

每次可以删除多个文件或目录

5）mkdir

# hadoop fs -mkdir <hdfs path>

只能一级一级的建目录，父目录不存在的话使用这个命令会报错

hadoop fs -mkdir -p <hdfs path>

6）cp

# hadoop fs -cp <hdfs file> <hdfs file>

目标文件不能存在，否则命令不能执行，相当于给文件重命名并保存，源文件还存在

hadoop fs -cp <hdfs file or dir> ... <hdfs dir>

7）text

# hadoop fs -text <hdfs file>

将文本文件或某些格式的非文本文件通过文本格式输出

8）mv

# hadoop fs –mv [hdfs file] [hdfs dir]

9）job—

# hadoop job -list

查看job

hadoop job -kill job_1569284136171_0001

中止job【job_id要复制】

9.集群运行wordcount

hadoop fs -mkdir /myin #fs方式创建文件夹

hadoop fs -put ./input/test.txt /myin #把本地test.txt传到集群

hadoop fs -ls /myin #查看input目录结构

hadoop jar/usr/hadoop/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /myin /myout #运行wordcount

hadoop fs -ls /myout #查看结果，跟本地结果一致

hadoop fs -cat /myout/part-r-00000

hadoop fs -get /myout/part-r-00000 /home #通过get命令，把文件下载到本地

ls #查看本地文件信息

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

shiosio CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

130万+: 周排名

12万+: 总排名

2962: 访问

: 等级

142: 积分

45: 粉丝

19: 获赞

5: 评论

16: 收藏

私信

关注

热门文章

分类专栏

Dataframe学习 3篇
Java 1篇

最新评论

DataFrame之查询＆切片操作
CSDN-Ada助手: 恭喜您写了第12篇博客！对DataFrame的查询和切片操作进行了深入探讨，内容丰富有启发性。希望您能继续坚持创作，不断提升自己的写作水平。下一步可以尝试结合实际案例，展示更多DataFrame操作技巧，期待您的更多精彩内容！祝您创作顺利！
DataFrame创建和基本属性
CSDN-Ada助手: 恭喜用户写了第10篇博客！对于DataFrame的创建和基本属性有了更深入的了解，这篇文章写得非常详细清晰。接下来，可以考虑深入探讨DataFrame的高级操作，比如数据过滤、排序、合并等，这样可以让读者更全面地了解DataFrame的应用。期待您的下一篇作品！愿您在创作的道路上不断进步，谦虚谨慎，不忘初心。
DataFrame数据操作
CSDN-Ada助手: 恭喜您发布了第11篇博客《DataFrame数据操作》，内容丰富且实用。希望您能继续坚持创作，分享更多有价值的内容给大家。下一步可以考虑深入探讨DataFrame数据操作的一些高级技巧，或者结合实际案例进行分析，让读者更加深入理解和运用这些知识。期待您的更多精彩文章！祝您创作顺利！
TypeError: only integer scalar arrays can be converted to a scalar index
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您在标题中遇到的问题“TypeError: only integer scalar arrays can be converted to a scalar index”，我觉得您对技术问题的探讨和解决能力很强。希望您能继续保持创作的热情，不断挑战自己，探索更多有价值的内容。建议您在下一篇博客中可以分享一些实际案例或者技术实践经验，让读者更易于理解和应用。加油！期待您的更多精彩内容。
大数据集群基础配置2
shiosio: NTP配置好像是存在问题，我有空再重新弄弄

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。