hadoop scala 读取文件

最新推荐文章于 2022-08-30 10:22:12 发布

记忆的残缺

最新推荐文章于 2022-08-30 10:22:12 发布

阅读量1.9k

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/u014017121/article/details/60584545

版权

hadoop 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

第一步下载IDEA 安装 scala 插件

第二步新建Scala 项目 TFinn

导入 spark-assemble-hadoop.jar 文件（具体可百度下载）

我下载的是 spark-assembly-1.3.1-hd-2.6.0.jar 因为我使用的hadoop2.7.3 (吃过亏，嘿嘿) 本来以为版本不一致会出差错，试过可以的。

第三步编写代码

package main.scala

import org.apache.spark.{SparkContext, SparkConf}
import org.apache.spark.SparkContext._
/**
  * Created by wen on 2017/3/6.
  */
object ReadFile {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("Join").setMaster("spark://xxx:7077")
    var sc =  new SparkContext(conf)
    var textFile = sc.textFile("hdfs://master:9000/input/text1.txt")
    println("==========================")
    println("====count:====",textFile.count())
    println(textFile.collect())
    println("==========================")
    sc.stop()
  }
}

第四步 导出 jar 文件

      上传到 spark 目录下面

	去掉没必要的jar

 执行 ./bin/spark-submit --class main.scala.ReadFile TFinn.jar

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

记忆的残缺

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop scala 读取文件

第一步下载IDEA 安装 scala 插件第二步新建Scala 项目 TFinn 导入 spark-assemble-hadoop.jar 文件（具体可百度下载）我下载的是 spark-assembly-1.3.1-hd-2.6.0.jar 因为我使用的hadoop2.7.3 (吃过亏，嘿嘿) 本来以为版本不一致会出差错，试过可以
复制链接

扫一扫