spark安装_windows下spark开发环境配置

最新推荐文章于 2024-09-04 11:00:00 发布

weixin_39641386

最新推荐文章于 2024-09-04 11:00:00 发布

阅读量363

点赞数

文章标签： spark安装

windows下spark开发环境配置

特注：windows下开发spark不需要在本地安装hadoop，但是需要winutils.exe、hadoop.dll等文件，前提是你已经安装了eclipse、maven、jdk等软件

spark支持jdk版本建议是1.8及以上，如果开发spark建议将jdk编译版本设置为1.8

我选择的spark是spark-1.4.0-bin-hadoop2.6.tgz，故以该版本为例

第一步：下载spark-1.4.0-bin-hadoop2.6.tgz到本地，并解压在本地目录

地址为：http://spark.apache.org/downloads.html

第二步：下载windows下hadoop工具包(分为32位和64位的)，在本地新建一个hadoop目录，必须有 bin目录例如：D:sparkhadoop-2.6.0bin

然后将winutil等文件放在bin目录下

地址：https://github.com/sdravida/hadoop2.6_Win_x64/tree/master/bin

第三步：配置hadoop和spark的环境变量：

HADOOP_HOME 例如：D:sparkhadoop-2.6.0

SPARK_HOME

SPARK_CLASSPATH

path中加入spark和hadoop

至此，在cmd命令下输入spark-shell 至此windows下配置ok了

搭建自己的spark maven项目hello world程序

对于已经安装了eclipse环境的程序员来说，不用再单独安装saprk的开发环境，由于spark是基于scala语言的，所以如果要想看源代码，需要安装scala的eclipse插件

第一步:安装scala的eclipse插件

地址：http://download.scala-ide.org/sdk/lithium/e44/scala211/stable/site

第一步：创建自己的spark maven项目

勾选create a simple project

第二步：选则maven生成的包，这里一定要选这jar，因为spark程序一般是打包为jar包的

其他必填自己按需填

第三步：添加spark的jar包到刚才新建的maven项目中

找到集群安装的spark安装目录，在lib目录下会看到

将加到maven项目的build path下

第四步：pom中添加自己的spark，hadoop maven依赖

例如：

org.apache.spark

spark-core_2.10

1.5.2

org.apache.spark

spark-sql_2.10

1.5.2

org.apache.hadoop

hadoop-client

1.2.0

第五部：spark程序的入口是main函数，至此可以编写自己的hello world并让它跑起来和调试

public class SparkMain implements Serializable {

public static void main(String[] args) throws Exception {

//编写自己的spark程序

System.out.println(“hello spark!”);

}

}

Now everything is ready for you to run your main Class. Enjoy!

--本篇由同事葛同学提供。

weixin_39641386

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。