伪分布式Hadoop+Spark+Scala的搭建

风中的云.

已于 2024-04-27 13:54:04 修改

阅读量928

点赞数 24

文章标签：运维大数据 hadoop spark scala

于 2024-04-27 12:44:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74038727/article/details/138244811

版权

本文详细介绍了如何在本地搭建伪分布的Hadoop、Spark和Scala环境，包括上传安装包、JDK配置、环境变量设置、配置文件编写、格式化HDFS以及解决Namenode和Datanode启动问题。同时，也涵盖了Spark和Scala的安装与运行过程。

摘要由CSDN通过智能技术生成

目录

一，伪分布Hadoop的搭建

1，上传安装包并卸载jdk自带的包

2，解压安装包到指定目录并编辑JDK环境

3，Hadoop的环境配置

解压安装包并将名字改为Hadoop，及编写环境变量

编辑其它配置文件

（1）编写hadoop-env.sh

（2）编写core-site.xml

（3）编写hdfs-site.xml

（4）改名并编辑mapred-site.xml

（5）编写yarn-site.xml

（6）编写salves

4，Hadoop的启动及集群的查看

！！！关于开启start -all.sh时Namenode和Datanode有时消失的解决办法

Namenode的解决办法

Datanode的解决方法

二，伪分布Spark的搭建

1，安装包解压

2，配置文件的改名及编写

3，进入spark集群并查看

4，启动spark-shell

三，伪分布Scala的搭建

1，解压安装包并配置文件

2，Scala的运行

一，伪分布Hadoop的搭建

1，上传安装包并卸载jdk自带的包

2，解压安装包到指定目录并编辑JDK环境

！！！编辑完要使它生效

3，Hadoop的环境配置

解压安装包并将名字改为Hadoop，及编写环境变量

编辑其它配置文件

（1）编写hadoop-env.sh

（2）编写core-site.xml

（3）编写hdfs-site.xml

（4）改名并编辑mapred-site.xml

（5）编写yarn-site.xml

（6）编写salves

格式化 hdsf

4，Hadoop的启动及集群的查看

！！！关于开启start -all.sh时Namenode和Datanode有时消失的解决办法

Namenode的解决办法

先查看端口，看是否被占用，如果被占直接kill - 9 端口号然后找到core-site.xml文件进行编写将里面的端口号改为其它

Datanode的解决方法

大部分是由于多次启动或格式化导致DataNode和Namenode的ID号不同

1，首先关闭所有进程stop -all.sh

2，进入Hadoop的安装目录找到存放data，name的目录（一般默认在Hadoop的tmp/dfs下）

更改ID号使其data和name里的VERSION clusterID相同（name和data里的都要更改）

更改完成后重新启动再输入jps就可以看到有Namenode及DataNode了

二，伪分布Spark的搭建

1，安装包解压

2，配置文件的改名及编写

3，进入spark集群并查看

4，启动spark-shell

输入：quit即可退出spark-shell

三，伪分布Scala的搭建

1，解压安装包并配置文件

2，Scala的运行

输入：quit即可退出Scala

关注

24
点赞
踩
21

收藏

觉得还不错? 一键收藏
2
评论
伪分布式Hadoop+Spark+Scala的搭建

2，进入Hadoop的安装目录找到存放data，name的目录（一般默认在Hadoop的tmp/dfs下）更改ID号使其data和name里的VERSION clusterID相同（name和data里的都要更改）大部分是由于多次启动或格式化导致DataNode和Namenode的ID号不同。更改完成后重新启动再输入jps就可以看到有Namenode及DataNode了。先查看端口，看是否被占用，如果被占直接kill - 9 端口号。输入：quit即可退出spark-shell。
复制链接

扫一扫

博客等级

码龄2年

5
原创

79
点赞

85
收藏

64
粉丝

关注

私信

热门文章

最新评论

伪分布式Hadoop+Spark+Scala的搭建
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hive的搭建
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
伪分布式Hadoop+Spark+Scala的搭建
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hive 组建安装
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。