idea测试spark程序

最新推荐文章于 2024-05-12 10:45:16 发布

docsz

最新推荐文章于 2024-05-12 10:45:16 发布

阅读量430

点赞数 1

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/docsz/article/details/104662746

版权

spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1：编写spark的WordCount程序
object WordCount {
def main(args: Array[String]): Unit = {

//创建spark配置
val conf = new SparkConf().setAppName("ScalaWordCount")
//创建spark入口
val sc = new SparkContext(conf)
//指定以后从哪里读取数据创建RDD
val lines = sc.textFile(args(0))
//切分压平
val words = lines.flatMap(_.split(" "))
//将单词和一组合
val wordAndOne = words.map((_,1))
// 按key进行聚合
val reduced = wordAndOne.reduceByKey(_+_)
// 排序
val sorted = reduced.sortBy(_._2,false)
//将结果保存到hdfs中
sorted.saveAsTextFile(args(1))
//释放资源
sc.stop()

}
}

2：配置idea远程连接服务器
在这里插入图片描述
3：idea配置ftp上传文件

4：idea打包jar并上传jar包

5：提交spark程序
spark-submit --master yarn --class cn.edu.core.WordCount original-spark-demo-1.0.jar hdfs://hdfs-ha/tmp/teragen/ hdfs://hdfs-ha/tmp/output

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
idea测试spark程序

1：编写spark的WordCount程序object WordCount {def main(args: Array[String]): Unit = {//创建spark配置val conf = new SparkConf().setAppName("ScalaWordCount")//创建spark入口val sc = new SparkContext(conf)//指定以后从...
复制链接

扫一扫

专栏目录

docsz CSDN认证博客专家 CSDN认证企业博客

码龄7年

117: 原创

1万+: 周排名

1万+: 总排名

14万+: 访问

: 等级

1536: 积分

3051: 粉丝

114: 获赞

25: 评论

299: 收藏

私信

关注

热门文章

分类专栏

数据分析 1篇
hive 29篇
springcloud 5篇
Doris&Starrocks 8篇
flink 7篇
python 1篇
hadoop 6篇
linux 11篇
nodejs 2篇
数据中台 4篇
dolphinscheduler 5篇
sqoop 4篇
Oracle 6篇
datax 18篇
vue 7篇
ranger 1篇
ssb基准测试 3篇
fate 2篇
MySQL 9篇
trino 1篇
github 2篇
spark 6篇
hbase 3篇
ELK 1篇
数据治理 1篇

最新评论

产品访问分析
weixin_47636659: 大哥又发博客了，受教了
Spark源码之Executor线程池
IT-Billy: 想问一下，为什么Executor用的是newCachedThreadPool而不是newFixedThreadPool这种固定线程池大小的呢，明明核数已经指定了executor同时运行几个task，用newFixedThreadPool不是更好吗
vue3.0添加typescript
kanfs: 最后的4 是 typescript 作者打错了
Windows安装Hadoop运行环境
Lion Long: 不错的文章，受益匪浅，文章内容丰富，条理清晰，值得一波关注！
DataX从MySQL写入MongoDB
zhaobibo1: 你好，我配置了writeMode，为什么mongdb中的数据还有重复的？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。