Spark wordcount 代码分析

Spark WordCount 源码解析

学习Spark有一段时间了,现在只处于会用的阶段,对内部代码和原理不怎么熟悉,乘着这几天有时间,解读一下源码,同时也熟悉一下scala语言

环境:

Spark 2.1.0
IntelliJ IDEA 15.0.2
Scala 2.10.4

废话不说,先上完整代码:

这里写图片描述

然后我们开始逐条代码分析:

if (args.length < 1) {

    System.err.println("Usage: JavaWordCount <file>");
    System.exit(1);
 }

因为我们的程序是计算单词的个数,所以需要有个单词源,即输入文件。所以在程序的开始先判断一下是否有输入目录,如果没有文件目录输入,程序打印错误日志,直接退出。如果输入正常,程序向下执行。

SparkSession spark = SparkSession
    .builder()
    .appName("JavaWordCount")
    .getOrCreate();

在spark2.0之后,引入了SparkSession这个类,SparkSession中包含SparkConf、SparkContext、SQLContext,再使用Spark的API时只需要创建一个SparkSession就可以了。

进入SparkSession中的getOrCreate()方法:

首先先获取一个SparkSession,这个SparkSession可以为null

var session = activeThreadSession.get()

我们先看一下activeThreadSession的声明

private val activeThreadSession = new InheritableThreadLocal[SparkSession]

InheritableThreadLocal 是 ThreadLocal的子类,是用来实现变量的线程安全的

获取SparkSession之后,


                
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值