IDEA读取本地文件进行处理的方式

最新推荐文章于 2024-04-25 14:34:39 发布

legotime

最新推荐文章于 2024-04-25 14:34:39 发布

阅读量5.8k

点赞数 2

分类专栏： scala 文章标签： intellij idea spark

本文链接：https://blog.csdn.net/legotime/article/details/51039452

版权

scala 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

第一种方式：

利用main中参数args方式，程序如下：

package algorithm
import org.apache.spark.{SparkContext, SparkConf}

object WordCount {
  def main(args: Array[String]) {
    //第一步：spark运行的环境，这个是必须的步骤
    val conf = new SparkConf().setAppName("WordCount").setMaster("local[2]")
    //第二步：创建SparkContext，它是spark程序的唯一入口
    val sc = new SparkContext(conf)

    val count=sc.textFile(args(0)).filter(line => line.contains("Spark")).count()
    //val count = sc.textFile("E://软件//BigData//spark-1.6.0-bin-hadoop2.6//spark-1.6.0-bin-hadoop2.6//README.md ").filter{
    //  line =>line.contains("Spark")
   // }.count()
    //打印结果
    println("count="+count)
    //结束进程
    sc.stop()
  }
}