spark
文章平均质量分 62
starxhong
毕业于华中科技大学,具有模式识别与智能系统硕士学位,现从业于广告智能推荐领域。
展开
-
spark groupByKey和groupBy,groupByKey和reduceByKey的区别
groupByKey、groupBy、reduceByKey的区别介绍原创 2022-06-12 21:38:14 · 922 阅读 · 0 评论 -
IDEA spark本地调试错误——“main“ java.lang.NoClassDefFoundError: org/apache/spark/broadcast/Broadcast
本地运行spark测试程序,报错如下:Error: A JNI error has occurred, please check your installation and try againException in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/broadcast/Broadcast at java.lang.Class.getDeclaredMethods0(Native Method) at jav原创 2021-09-22 11:08:47 · 755 阅读 · 0 评论 -
spark运行错误集锦(持续更新)
文章目录问题1: Spark 启动java.lang.NoClassDefFoundError: com/fasterxml/jackson/databind/Module问题1: Spark 启动java.lang.NoClassDefFoundError: com/fasterxml/jackson/databind/Module解决方法:使用Maven下载以下依赖 : jackson-databind-xxx.jar、 jackson-core-xxx.jar、 jackson-annotatio原创 2021-06-30 15:25:33 · 268 阅读 · 0 评论 -
Warning: Local jar /data/myProject/4 does not exist, skipping报错
最近shell脚本写spark脚本:$SPARK_BIN --master yarn-client --name openrc_${bid}_${model}_es@${running_id} --queue ${queue} \ --class com.tencent.dp.gr.driver.CTR1 \ --conf spark.hadoop.fs.hdfs.impl.d...原创 2018-11-26 17:17:49 · 3273 阅读 · 2 评论 -
IDEA编译通过能打包能运行,但是出现红色下划线
转自:https://blog.csdn.net/medtc/article/details/80018470昨天使用IDEA本来正常重新打开IDEA之后,有一个包里面的类总是报错找不到,各种clean还是不行;能编译能打包通过说明SDK导入正确,但是为啥我们点击每一个Java文件会出现好多红色的下划线?网上查到原因就是可能没有清除原来的历史缓存,导致一些错误,解决方法是 File-I...转载 2018-08-17 16:28:00 · 1855 阅读 · 0 评论 -
spark中使用groupByKey进行分组排序
任务需求:已知RDD[(query:String, item_id:String, imp:Int, clk:Int)],要求找到每个query对应的点击最多的前2个item_id,即:按照query分组,并按照clk降序排序,每组取前两个。例如:(连衣裙,1234, 22, 13)(牛仔裤,2768, 34, 7)(连衣裙,1673,45, 9)(衬衣,3468, .........原创 2018-08-13 22:10:52 · 25005 阅读 · 6 评论 -
Scala ERROR: forward reference extends over definition of value xxx——错误解决方案
项目编译打包时的错误,有点莫名其妙。网上找了一些问题原因,稍微记录一下:1,方法调用和定义间插入了val的定义you're calling a method before you define it, and that the definition of the value x appears between that forward reference and the definitio...原创 2018-08-13 21:52:03 · 5950 阅读 · 0 评论 -
IntelliJ IDEA 中 右键新建(new)时,选项没有scala(java) class的解决方法和具体解释
项目是用Maven 创建的,具体的创建过程就不做解释了。出现的问题如下: 具体问题的图,如下:打开设置界面的路径如下: 主界面File——>Project Structure——>modules 如上图红圈所示,我们可以根据对项目的任意目录进行这五种目录类型标注,这个知识点非常非常重要,必须会。 Sources 一般用于标注类似 src 这种可编译目录。有时候我们不单...转载 2018-08-13 20:38:33 · 2402 阅读 · 0 评论 -
spark踩坑记——windows环境下spark安装和运行
本文主要记录windows系统上安装spark,scala,和intelj IDEA,并实现本地spark运行。同时介绍了利用maven构建工具对spark工程构建的方法。本地运行需要本地安装scala,spark,hadoop。而如果利用maven构建工具则只需要再maven的pom.xml配置好需要的scala,spark,hadoop版本信息,构建时自动导入相应依赖,常用于企业级的项目开发中......原创 2018-08-10 17:08:10 · 56184 阅读 · 12 评论 -
spark错误ERROR LiveListenerBus: SparkListenerBus has already stopped!
报错:ERROR LiveListenerBus: SparkListenerBus has already stopped!报错位置:if(configure.ifdebug){ Common.colorful_println("print topItem_set_with_sort_feaNum:\n") topItem_set_with_sort_feaNum.foreac...原创 2018-08-09 22:13:55 · 9031 阅读 · 0 评论