scala

第1关:WordCount - 词频统计

import org.apache.spark.rdd.RDD  
import org.apache.spark.{SparkConf, SparkContext}
object WordCount {  
  def main(args: Array[String]): Unit = {  
    val conf = new SparkConf().setMaster("local").setAppName("WordCount")  
    val sc = new SparkContext(conf)  
    val path = "file:///root/files/wordcount.txt"  
    /********* Begin *********/  
    //读取文件创建RDD  
    val file = sc.textFile(path)  
    //切分并压平  
    val words: RDD[String] = file.flatMap(_.split(" "))  
    //   组装  
    val wordsAndone: RDD[(String, Int)] = words.map((_,1))  
    //    分组聚合  
    val result: RDD[(String, Int)] = wordsAndone.reduceByKey(_+_)  
    //    排序  
    val result1: RDD[(String, Int)] = result.sortBy(_._2,false)  
    //输出  
    result1.foreach(println)  
    /********* End *********/  
    sc.stop()  
  }
}

 

第1关:SparkContext初始化

import org.apache.spark.{SparkConf, SparkContext}
object Test {  
    def main(args: Array[String]): Unit = {  
    /********** Begin **********/  
    //设置SparkConf  
    val conf =new            SparkConf().setAppName("educoder").setMaster("local")  
    //初始化SparkContext  
    val sc=new SparkContext(conf)  
    /********** End **********/  
    val sc1=sc.parallelize(List("hello","world"))  
    sc1.foreach(print)  
    /********** Begin **********/  
    //关闭SparkContext  
    sc.stop()  
    /********** End **********/  
  }  
  }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值