个人任务备注_编写提交spark任务的springboot接口

最新推荐文章于 2023-02-13 15:03:10 发布

无恋-zx

最新推荐文章于 2023-02-13 15:03:10 发布

阅读量1.6k

点赞数

分类专栏： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29726869/article/details/82686772

版权

java 专栏收录该内容

105 篇文章 2 订阅

订阅专栏

完成加载词库接口,和查询spark任务状态接口,销毁spark任务接口

加载词库接口执行流程:

1.springboot的接口提交加载词库任务并指定运行参数到spark集群,spark集群获取hdfs上事先上传好的词库分析项目jar包并运行指定main方法(注:程序中如果有第三方依赖,则打包时需要添加上)

2.加载词库程序中开始读取hdfs上输入法词库(一级/二级utf8_txt词库)生成SparkRDD,进行加载过滤,转换,追加分类值等操作,最终结果(词条,一级分类-二级分类+空格+一级分类_二级分类...的结构)

3.然后加载词库程序中使用httpClient调用自定义词库管理项目的获取自定义词库内容接口得到数据(词条,一级分类-二级分类的结构)并生成SparkRDD

4.合并输入法词库RDD和自定义词库RDD,进行合并,去重,转换,对于相同的词条,合并后则追加分类

5.最终加载词库的结果上传到hdfs上保存,以便后续用户数据分析使用.

备注:

加载词库程序耗时测试,申请10核cpu,20g内存使用5个节点,执行耗时70-80秒

重点:

spark任务提交方式由以前的sparksubmit client模式本地driver调用远程spark worker计算方式修改为调用spark提供的restful接口,使用cluster模式,远程driver启动,调用远程spark worker计算

sparksubmit client 调用模式可用于本地远程spark任务调试,输出语句打印在本地控制台(缺陷:本地需要安装spark环境,相当于本机也是一个节点,程序运行时作为driver端,申请spark计算和调度,接受worker端的计算结果)

sparkresful cluster调用模式可用于实际开发spark任务提交,输出语句打印在远程spark集群上某一台driver端(driver端由spark集群执行任务时自动分配) 本地不需要安装spark环境,任务可通过spark webUI进行监控打印输出

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
个人任务备注_编写提交spark任务的springboot接口

完成加载词库接口,和查询spark任务状态接口,销毁spark任务接口加载词库接口执行流程:1.springboot的接口提交加载词库任务并指定运行参数到spark集群,spark集群获取hdfs上事先上传好的词库分析项目jar包并运行指定main方法(注:程序中如果有第三方依赖,则打包时需要添加上)2.加载词库程序中开始读取hdfs上输入法词库(一级/二级utf8_txt词库)生成S...
复制链接

扫一扫

专栏目录

无恋-zx CSDN认证博客专家 CSDN认证企业博客

码龄9年

146: 原创

4万+: 周排名

135万+: 总排名

60万+: 访问

: 等级

5019: 积分

75: 粉丝

135: 获赞

59: 评论

1010: 收藏

私信

关注

热门文章

分类专栏

k8s-docker 19篇
groovy 1篇
Linux 32篇
python学习之路 17篇
机器学习 3篇
scala 16篇
spark 31篇
java 105篇
go 6篇
open-falcon 1篇
node.js 8篇
前端 4篇

最新评论

给大家推荐8个SpringBoot精选项目
endlesswater: 可以的，我看的另一个SpringBoot视频，从零开发，十天掌握了项目实战：https://knife.blog.csdn.net/article/details/134911141
干净卸载docker 解决rancher k8s集群搭建失败的环境问题
百香熊猫果: 确实，太暴力了，万一有其他容器数据就没了
docker 彻底卸载
OnE.♘: 请问博主用rm -rf /var/lib/docker命令删除关于docker的目录之后，我为啥还能查到docker目录呀
docker 彻底卸载
s666666__: 我是启动docker服务的时候报了你的这个错误，好像是因为少了 /etc/systemd/system/docker.service 这个文件，后来卸载重新安装就正常了（可以备份 /var/lib/docker 文件夹确保镜像容器等数据不丢失）
docker 彻底卸载
赴前尘: yum -y remove docker.x86_64 =》 yum -y remove docker*.x86_64

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。