JAVA CV工程师学习大数据之路---hadoop安装及HelloWorld

最新推荐文章于 2023-05-31 14:51:23 发布

咸鱼哥哥

最新推荐文章于 2023-05-31 14:51:23 发布

阅读量393

点赞数

分类专栏：大数据 java学习大数据 hadoop 文章标签： hadoop hadoop搭建学习大数据 java学习大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36324464/article/details/102839492

版权

java学习大数据同时被 3 个专栏收录

4 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1.安装jdk环境以及hadoop。

输入java -version 查看系统是否自带java

rpm -qa | grep java 
rpm -e javaXXXX  #将上一条命令的结果输入到后边的参数进行卸载

也可以使用下边的命令一键卸载

 rpm -qa | grep java | xargs sudo rpm -e --nodeps

接下来在我的网盘下载jdk1.8和hadoop2.7.2的安装包

链接：https://pan.baidu.com/s/11b9NF7qg1WYyahFmzZJa5A
提取码：uxca

下载完安装包后，创建文件夹/opt/module，将文件解压在/opt/module下

tar -zxvf jdk-8u144-linux-x64.tar.gz  -C /opt/module/

tar -zxvf hadoop-2.7.2.tar.gz -C /opt/module/

接下来在vi /etc/profile文件末端添加环境变量，路径指向刚刚解压的文件路径

JAVA_HOME 和 HADOOP_HOME均需要配置

输入 source /etc/profile 命令将修改后的配置文件生效

最后执行java -version 和hadoop version可以看到相应的信息

Hadoop目录介绍：

bin: 存放脚本的目录，操作文件系统时用到的一些脚本

sbin: 存放管理脚本的目录，主要是HDFS/YARN的开启关闭等

start-dfs.sh: 启动NameNode ，SecondaryNamenode ，DataNode

start-yarn.sh: 启动ResourceManager,nodeManager

stop-dfs.sh: 关闭NameNode ，SecondaryNamenode ，DataNode

stop-yarn.sh：关闭ResourceManager,nodeManager

etc:存放一些hadoop的配置文件，部署时也是主要修改这个目录下的配置信息

core-site.xml: Hadoop核心全局配置文件，可以其他配置文件中引用该文件中定义的属性，如在hdfs-site.xml及mapred-site.xml中会引用该文件的属性

hadoop-env.sh：Hadoop环境变量

yarn-site.xml：yarn的配置文件

slaves：用于设置所有的slave的名称或IP

lib: 该目录下存放的是Hadoop运行时依赖的jar包

share: Hadoop各个模块编译后的jar包所在的目录

配置完环境后，执行下官网提供的helloword程序(单机版)

https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster.html

修改hadoop相关的一些配置文件

修改 etc/hadoop/hadoop_env.sh文件。将JAVA_HOME的值改为当前系统的java安装路径
执行bin/hadoop命令，可以看到一些关于hadoop的文档信息
mkdir input // 在hadoop目录下创建一个输入文件夹
cp etc/hadoop/*.xml input // 拷贝文件，其中包含着hadoop提供的demo程序
在hadoop-2.7.2目录下执行 bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+' // 运行官方提供的案例 marreduce-example
cat output/* // 查看输出，output文件夹是自动生成，运行时需保证该文件夹不存在

至此hadoop单机基本搭建完成

WordCount案例

在hadoop目录下创建文件夹wcinput: mkdir wcinput
在wcinput目录下创建一个文本随机输入一些单词，命名为wc.input.内容如下

执行如下命令

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

含义是：hadoop执行hadoop-mapreduce-examples-2.7.2.jar包下的wordcount主类(可以参考上边demo，这儿是另外一个主类了)。输入文件夹是wcinput，输出文件夹是wcoutput。

执行完后 cat output/*可以看到文本中的单词计数结果

hadoop搭建以及单机版demo完成~

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JAVA CV工程师学习大数据之路---hadoop安装及HelloWorld

1.安装jdk环境以及hadoop。输入java -version 查看系统是否自带javarpm -qa | grep javarpm -e javaXXXX #将上一条命令的结果输入到后边的参数进行卸载也可以使用下边的命令一键卸载rpm -qa | grep java | xargs sudo rpm -e --nodeps接下来在我的网盘下载jdk1.8和h...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。