Spark shell使用案例

最新推荐文章于 2023-07-07 16:54:19 发布

骑码找马

最新推荐文章于 2023-07-07 16:54:19 发布

阅读量402

点赞数

分类专栏：大数据文章标签： Spark shell使用

本文链接：https://blog.csdn.net/weixin_42034217/article/details/102558489

版权

大数据专栏收录该内容

45 篇文章 3 订阅

订阅专栏

第一步：import org.apache.spark.{SparkConf, SparkContext}
第二步：val SparkConf = new SparkConf().setAppName("My_App").setMaster("local[2]")
第三步：val sc = new SparkContext(SparkConf)
第四步：sc.parallelize(List(1,2,3,4,5)).count

package com.ht.hadoop.service

import com.alibaba.fastjson.JSONArray
import com.ht.hadoop.util.ObjGenerator
import org.apache.spark.SparkContext
import org.apache.spark.sql.SparkSession
import org.springframework.beans.factory.annotation.Autowired
import org.springframework.stereotype.Service

@Service
class WordCountService {
  @Autowired
  private val sparkSession: SparkSession = null

  def wordCount(filePath: String): JSONArray = {
    val sc: SparkContext = sparkSession.sparkContext
    val fileRdd = sc.textFile(filePath).flatMap(_.split(" "))
      .map((_, 1))
      .reduceByKey(_ + _)
    val wordCountArray: JSONArray = new JSONArray()
    fileRdd.collect().foreach(x => {
      wordCountArray.add(ObjGenerator.newJSON(Seq((x._1, x._2)): _*))
    })
    wordCountArray
  }
}

骑码找马

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark shell使用案例

第一步：import org.apache.spark.{SparkConf, SparkContext}第二步：val SparkConf = new SparkConf().setAppName("My_App").setMaster("local[2]")第三步：val sc = new SparkContext(SparkConf)第四步：sc.parallelize(List(1...
复制链接

扫一扫