Windows环境下编写Spark程序经常遇到的一个BUG及解决方案

本文介绍了在Windows环境下开发Spark时,遇到`winutils.exe`缺失的问题及其解决办法。首先,文章讲解了Spark的主要组件和开发语言。接着,详细阐述了配置JDK、Hadoop环境的步骤,并指出环境变量配置的重要性。在问题点部分,作者描述了运行Spark程序时遇到的`winutils.exe`错误,解释了原因,并提供了获取和放置相关文件的解决方案。最后,作者表示将分享更多关于Spark和Java 8的技术内容。
摘要由CSDN通过智能技术生成

在这里插入图片描述
1、前言
Spark是继Hadoop,Hive,Storm之后开发的一款高效,便捷的大数据开源框架,其主要有Spark-core,Spark-SQL,Spark-Streaming,Spark-Mllib。并且它可以用单机模式,基于Mesos,Standalone,Yarn来开发。

其中,Spark一般可用来读取本地文件做离线处理用,Spark-SQL提供了一套偏向于传统SQL语句的命令,便于更多开发人员的使用,Spark-Streaming是用于实时处理的情况下,但目前而言相比于Storm的一条一条的信息处理,SparkStreaming还是偏向于批处理,而最后的Spark-MLlib是集合了目前最火的机器学习的部分重要算法,使得开发人员更加高效的利用这些API。

Spark的开发语言主要是Scala,Java,Python,但是Scala是开发效率最高的,这与它的函数式编程思维离不开,但是在某些情况下,比如小编的公司需要利用Java来开发,这便有些“坑”了,还好JAVA SE8提供了Stream式编程和Lambda表达式,使得开发起来相对也能容易一些了,日后我会逐步更新JAVA SE8的Lambda和Stream,以及Spark的更多应用,今天的内容主要是针对我们在Windows坏境下开发Spark会遇到的一个问题及解决办法。

2、配置文件
1、首先我们系统得配置JDK环境,基于Spark的开发习惯,建议使用JDK8以上版本,我们可以去官网下载JDK8,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值