scala打印服务器消息,Spark中使用Scala实现WordCount业务

Spark中使用Scala实现WordCount业务

9451ffb052bf

创建一个Project

9451ffb052bf

sbt选择1.0.4

9451ffb052bf

Scala选择2.11.8

9451ffb052bf

配置路径

Project Sources

9451ffb052bf

Dependencies

9451ffb052bf

新建object

MyScalaWordCount.scala

本地模式

object MyScalaWordCount {

def main(args: Array[String]): Unit = {

val conf = new SparkConf().setAppName("MyScalaWordCount").setMaster("local");

//创建一个SparkContext对象

val sc = new SparkContext(conf)

//执行WordCount

val result = sc.textFile("hdfs://bigdata02:9000/wordcount.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

//打印在屏幕上

result.foreach(println)

//释放资源

sc.stop()

}

}

9451ffb052bf

9451ffb052bf

导出Jar包在服务器上运行

MyScalaWordCount.scala

生成jar包

object MyScalaWordCount {

def main(args: Array[String]): Unit = {

val conf = new SparkConf().setAppName("MyScalaWordCount");

//创建一个SparkContext对象

val sc = new SparkContext(conf)

//执行WordCount

val result = sc.textFile(args(0)).flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

//打印在屏幕上

result.foreach(println)

//释放资源

sc.stop()

}

}

打包操作

Project Sources

9451ffb052bf

Artifacts

9451ffb052bf

Build Artifacts

9451ffb052bf

9451ffb052bf

导出成功

9451ffb052bf

上传Jar包到服务器并执行

cd /home/bigdata/apps/spark-2.1.0-bin-hadoop2.7

./bin/spark-submit --master spark://bigdata02:7077 --class nx.MyScalaWordCount /home/bigdata/data/SparkScalaWork.jar hdfs://bigdata02:9000/wordcount.txt hdfs://bigdata02:9000/output/spark/wc0928

9451ffb052bf

9451ffb052bf

hdfs dfs -cat /output/spark/wc0928/part-00000

9451ffb052bf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值