在spark里面使用jar包运行java项目

Lcy丶

于 2022-04-02 21:14:00 发布

阅读量3.7k

点赞数

文章标签： spark java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lichao1618/article/details/123928768

版权

读取文件，统计相同数据的个数

 //创建spark配置对象   .setMaster("local") 使用jar运行不需要在代码里面设置
    val conf = new SparkConf().setAppName("wc")
    //      .setMaster("local")
    //创建上下文对象
    val sc = new SparkContext(conf)

    //读取数据 按行读取
    // 使用jar包运行就要文件路径改为 动态输入用args(0) 
    // val lineRDD = sc.textFile("data/day12/words.txt")
    val lineRDD = sc.textFile(args(0))

    //使用flatMap切分数据  扁平化 炸开数据
    var wordRDD = lineRDD.flatMap(s=>{
      s.split("\\s+")
    })

    //将每个单词进行计数
    val countRDD = wordRDD.map(w => {
      (w, 1)
    })

    //将相同的数据 放在一起  用分组
    val grpRDD = countRDD.groupByKey()

    //统计数据 个数
    var resRDD = grpRDD.map(m =>
      (m._1, m._2.sum)
    )

    //RDD的数据不能直接输出  需要使用foreach输出
   // println(lineRDD)
    //收集结果打印输出  如果使用jar包运行需要加上collect
    resRDD.collect.foreach(println(_))

    //关闭对象
    sc.stop()

将项目打成jar包，上传到linux里面

跳转到spark路径下使用命令

bin/spark-submit --master local --class 项目类的全限定名

linux里面jar包的pwd路径 file:/linux中要读取文件的pwd路径

如：

bin/spark-submit --master local --class Practice12.WcTest3

/root/jars/original-scala_test-1.0-SNAPSHOT.jar file:/root/data/words.txt

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
在spark里面使用jar包运行java项目

在spark里面使用jar包运行java项目
复制链接

扫一扫

Lcy丶 CSDN认证博客专家 CSDN认证企业博客

码龄2年

8: 原创

76万+: 周排名

11万+: 总排名

3万+: 访问

: 等级

104: 积分

11: 粉丝

17: 获赞

9: 评论

35: 收藏

私信

关注

热门文章

最新评论

Linux环境安装Anaconda3，并配置Jupyter Notebook远程连接
CSDN-Ada助手: 恭喜您成功写了第7篇博客！标题中提到的Linux环境安装Anaconda3并配置Jupyter Notebook远程连接，对于想要在Linux环境上使用Anaconda和Jupyter Notebook的读者来说，无疑是一篇非常有用的文章。您的分享不仅帮助到了其他人，也展示了您对技术的深入理解。同时，我想为您的博客创作之路鼓掌。您以谦虚的态度详细介绍了安装和配置过程，让读者能够轻松跟随您的指导完成操作。在下一步的创作中，您可以考虑分享一些使用Anaconda3和Jupyter Notebook的实际案例，或者介绍一些常见问题的解决方法。这样的内容将进一步丰富您的博客，并为读者提供更多实践经验。再次祝贺您，并期待您发布更多有趣且实用的博客！
Linux环境安装Anaconda3，并配置Jupyter Notebook远程连接
Lcy丶: 用的centos7.8版本
启动mysql报错Job for mysqld.service failed because the control process exited with error code.
KKK123499999: 对少了
启动mysql报错Job for mysqld.service failed because the control process exited with error code.
m0_52231664: 还是报错Job for mysqld.service failed because the control process exited with error code. See "systemctl status mysqld.service" and "journalctl -xe" for details
启动mysql报错Job for mysqld.service failed because the control process exited with error code.
回忆de天空: 那块少了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。