idea配置spark环境

本文详细指导如何在2021年IDEA中配置Maven环境,包括下载、镜像设置、repository管理,以及如何配置Hadoop和Spark的环境变量,包括sparkjars包的添加。
摘要由CSDN通过智能技术生成

 1. 首先,需要准备maven的环境配置,我的idea是2021版本,(新版应该差不多)

下载maven的版本包,建议去官网下载Maven – Maven Releases History (apache.org)

建议下载版本是3.8.8

然后进入settings里的maven界面

将maven home path 设置为你下载的路径:

此时下面的version会改变

随后打开路径中的maven包,选择conf文件夹,选择settings.xml,用vscode打开

找到<mirror>镜像设置,注释掉原来的,添加阿里云的镜像(去浏览器搜索aliyun maven即可复制)

配置完成后在文件夹外多创建一个repository文件夹

回到idea,点击右侧的override重写

然后打开文件目录,第一个选择你刚刚配置的settings,第二个选择你创造的repository文件夹,

点击apply(一定要点击!!!)

然后你的maven就配置好了,最好是在最开始的idea界面配置,别打开任何的工作空间。

就是在这个界面,选择customize的all settings:

然后创建新的project,选择maven,建立新的工作空间即可。

2.配置hadoop环境变量

由于windows与hadoop不兼容,建议去下载winutils。

项目概览 - winutils - GitCode

下载zip,选出hadoop-3.0.0版本(建议)

点击我的电脑-属性-高级系统设置-环境变量,在系统变量里新建一个系统变量,如下图:

然后进入Path(系统变量里的),新建一个:

hadoop环境变量配置完成

3.spark jars包的配置

去官网下载spark的3.5.0版本(建议)

Index of /dist/spark (apache.org)

选择3.5.0-hadoop3-scala.2.13的tgz

下载完成后解压,随后进入idea的新project里面,打开file-project structure:

点击library中的加号:

先选择scala sdk,2.13.12版本:

然后添加spark的jars包(记得选中jars文件夹):

然后再modules的dependencies勾选刚刚添加的两个libraries:

点击apply(一定!!!),随后点ok退出

这样就完成所有步骤了,编写spark独立应用程序吧。

  • 0
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值