3.Spark 操作

最新推荐文章于 2024-07-25 23:49:05 发布

_胡杨_

最新推荐文章于 2024-07-25 23:49:05 发布

阅读量471

点赞数

分类专栏： Spark 文章标签： spark 大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45097792/article/details/125281429

版权

Spark 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

基于centos7 ，hadoop2.7.3， spark-2.4.4-bin-hadoop2.7.tgz

目录：

一.spark shell
二. 读取hdfs文件
三.Idea中编写wordcount

一.spark shell

在spark shell中编写wordcount程序读取本地文件

1、准备数据源（创建目录，创建文件）
在这里插入图片描述
2.代码：

--注意修改文件地址--
sc.textFile("/opt/spark/spark-2.4.4-bin-hadoop2.7/data/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

在这里插入图片描述

二. 读取hdfs文件

1.在hadoop创建目录和文件
在这里插入图片描述
2.代码

sc.textFile("hdfs://hy:9000//tmp/userzrt/111.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

在这里插入图片描述

三.Idea中编写wordcount

1.Lambada表达式编写wordcount
（1）创建maven项目
（2）配置maven仓库
在这里插入图片描述

在这里插入图片描述
（3）导入依赖

<dependencies>
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.12</artifactId>
        <version>2.4.3</version>
    </dependency>
    </dependencies>

在这里插入图片描述
（4）创建数据目录（datas）

（5）创建包和类
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
3.Spark 操作

3.Spark 操作
复制链接

扫一扫

专栏目录

_胡杨_ CSDN认证博客专家 CSDN认证企业博客

码龄5年

39: 原创

1万+: 周排名

66万+: 总排名

8万+: 访问

: 等级

638: 积分

6656: 粉丝

70: 获赞

68: 评论

564: 收藏

私信

关注

热门文章

分类专栏

系统设计 1篇
Hadoop 8篇
Linux 8篇
Spark 3篇
Echarts 3篇
java 1篇
odpscmd 10篇
HTML 1篇
python 3篇
IDEA 1篇
MySQL
Hive

最新评论

Centos7 关于启动时显示Oh no Something has gone wrong.
m0_73129543: 重装系统后才这样的怎么办
Centos7 关于启动时显示Oh no Something has gone wrong.
Izumi和泉: 按ctrl+alt+F2无反应怎么办
1.宿舍管理系统
CSDN-Ada助手: 非常感谢您分享了关于宿舍管理系统的博客！宿舍管理系统在大学中起着重要作用，同时它也是一个充满挑战的领域。希望您能继续深入挖掘这个话题，分享您的经验和见解，鼓励更多人参与到这个领域中来。建议您写一篇关于“如何设计一个高效的宿舍管理系统”的博客，分享您的设计经验和技巧，探讨如何提高宿舍管理系统的效率和用户体验。这个话题涉及到很多方面，比如UI设计、数据库设计、性能优化等等，相信您一定能写出一篇精彩的博客，也能为其他人提供有价值的参考。期待您的精彩分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
1.数据可视化 idea+tomcat+Echarts
看雾碎云成词: 这个怎么导入数据库数据
Centos7 关于启动时显示Oh no Something has gone wrong.
m0_74741176: 现在搞好了吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

_胡杨_ 感谢打赏，会多多更新的。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。