SparkContext任务本地开发与服务器运行

正确启动spark的本地模式与standalone模式之后,我们进入spark项目的开发。

1.本地开发:

在IDEA中新建一个maven工程:

1)maven基础坐标如下:

  <groupId>com.imooc.spark</groupId>
  <artifactId>sql</artifactId>
  <version>1.0</version>

2)项目名称:

ImoocSparkSqlProject

3)在pom文件中修改scala与spark的版本信息

<dependencies>
    <dependency>
      <groupId>org.scala-lang</groupId>
      <artifactId>scala-library</artifactId>
      <version>${scala.version}</version>
    </dependency>
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-sql_2.11</artifactId>
      <version>${spark.version}</version>
    </dependency>
</dependencies>

第一次使用maven项目时,导入jar包的时间会非常久,请耐心等待

 

4)在原先创建的项目“ImoocSparkSqlProject”下,新建scala的object

package com.imooc.spark

import org.apache.spark.{SparkContext, SparkConf}
import org.apache.spark.sql.SQLContext


object SQLContextApp {
  def main(args: Array[String]) {
    val path = args(0)
    //path为放置json文件的地方

    //1.创建相应的Context
    val sparkconf = new SparkConf()

    //在生产环境中,appName与master均通过脚本指定
    sparkconf.setAppName("SQL").setMaster("local[2]")

    val sc = new SparkContext(sparkconf)
    val sqlcontext = new SQLContext(sc)

    //2.相关处理
    val people = sqlcontext.read.format("json").load(path)
    people.printSchema()
    people.show()

    //3.关闭资源
    sc.stop()

  }

}

5)运行项目

输入本地文件的地址:

得出结果:

6)部分报错:

在本地运行时可能会报错“ERROR Shell: Failed to locate the winutils binary in the hadoop binary path

这是因为window本身的原因,不影响使用,如果有强迫症,那么百度一下,解决方法很多~

 

 

2.服务器开发:

服务器上运行与本地的不同在于,运行的模式,任务名均可以由外部指定;故可以修改代码,同理,此处不注释,就放在本地指定也是ok的

1)本地代码修改与打包

    //在生产环境中,appName与master均通过脚本指定
    //sparkconf.setAppName("SQL").setMaster("local[2]")

然后打jar包,此处除了本地的main文件,其他的jar依赖包均可删除,不然jar包会太大

2)服务器运行(此处不需要打开spark客户端

spark-submit \
--name SQLContextApp \
--class com.imooc.spark.SQLContextApp \
--master local[2] \
/home/xxx/jar/ImoocSparkSqlProject.jar \
/home/xxx/app/spark-2.1.0-bin-2.6.0-cdh5.7.0/examples/src/main/resources/people.json



name:手动指定任务名
class:项目的class
master:运行模式
随后两个,一个是jar包的位置,一个是spark自己提供的示例文件的路径

此处运行则不会再报在本地运行的错误“ERROR Shell: Failed to locate the winutils binary in the hadoop binary path”了,同时得出结果

3)web端查看(此处地址为loacl模式的地址:4040端口,且手速要快,不然将还未看到信息网站就已关闭

 

最后,代码附件:https://download.csdn.net/download/h_hanwen/10797252

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值