Window下Spark环境搭建(可跑代码调试)

前言

这篇博客是在同事的帮忙下完成的,这里我做一个记录,感谢牛逼的同事一波先。哈哈。

本篇博客目的是指导搭建一个Spark的调试环境,在Win10下面
本人使用的开发工具是IDEA,博客里面用的的所有依赖包会在博客后面分享给需要的朋友,希望能帮助你,跨好大数据入门的一步。

准备工作

为了搭建Spark的调试环境,我们下面需要准备一些工具:

  • hadoop-2.8.5.tar(Spark需要依赖于Hadoop)
  • scala-2.11.12
  • winutils-master(hadoop不可以直接在Win下运行,所以需要这个工具)
  • IDEA 2018
  • jdk1.8、maven等基础环境

下载安装包

  1. 下载Spark
    我们知道Spark的启动需要依赖于Hadoop,通过官方的说明,可以知道它是在Hadoop对应的版本上面进行构建的
    我们先到Spark官网看看,然后选择我们需要的Spark版本。
    在这里插入图片描述
    我下载spark-2.4.0-bin-hadoop2.7这个版本。

    根据官网提供的信息,这个Spark版本,构建在Hadoop2.7之后的版本,并且需要Scala版本2.11

  2. 下载Scala

    根据我们Spark的版本,我们到Scala官网下载2.11.12这个Scala SDK版本
    在这里插入图片描述

  3. 下载Hadoop
    接下来,我们需要到Hadoop官网下载,对应版本的Hadoop.
    在这里插入图片描述

  4. 下载winutils-master

由于在win下不可以运行hadoop,虽然我们下载了Hadoop的软件包,还是不可以直接使用。
为了解决这个问题,我们需要额外下载一个东西winutils-master。

在这里插入图片描述
然后把里面hadoop-2.8.3\bin里面的文件替换到我们之前hadoop源码包的bin目录下。

环境变量的配置

软件包已经下载完成了,我们开始进行环境变量的配置!

在这里插入图片描述

环境变量的配置中,我们需要把环境变量配置在系统变量里面。

如果配置在用户变量里面,当管理员运行用户运行项目的时候,读取不到我们配置的

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值