spark
spark
新鲜氧气
这个作者很懒,什么都没留下…
展开
-
Spark累加器LongAccumulator
1.Accumulator是由Driver端总体进行维护的,读取当前值也是在Driver端,各个Task在其所在的Executor上也维护了Accumulator变量,但只是局部性累加操作,运行完成后会到Driver端去合并累加结果。2、不改变Spark作业懒执行的特点,即没有action操作触发job的情况下累加器的值有可能是初始值。1、只会累加,合并即累加;原创 2024-01-24 16:30:54 · 812 阅读 · 0 评论 -
spakr 提交任务
-num-executors 24 用于设置Spark作业总共要用多少个Executor进程来执行。--executor-memory 2g :用于设置每个Executor进程的CPU core数量。--executor-cores 2 用于设置每个Executor进程的CPU core数量。--deploy-mode:部署模式(client/cluster)--driver-memory 2g Driver内存。--driver-cores 2 Driver核数。--master:集群地址。原创 2024-01-17 15:40:14 · 568 阅读 · 0 评论 -
spark 关联外部数据
【代码】spark 关联外部数据。原创 2024-01-10 17:43:28 · 361 阅读 · 0 评论 -
spark combineByKey和聚合函数
Spark combineByKey、聚合函数原创 2024-01-10 14:42:35 · 470 阅读 · 0 评论 -
scala匿名函数
scala匿名函数原创 2023-12-27 10:12:32 · 579 阅读 · 0 评论 -
Scala安装
scala详细安装步骤原创 2023-12-25 16:33:49 · 652 阅读 · 0 评论 -
Scala(一)基本类型
这部分跳过,直接使用IDEA进行搭建,和其他编程语言配置差不多。原创 2023-12-25 16:18:42 · 1301 阅读 · 2 评论 -
Scala安装与配置
1、安装Scala需要Java运行时库,安装Scala需要首先安装JVM虚拟机,推荐安装JDK1.8。在http://www.scala-lang.org/ 下载Scala2.11.8程序安装包根据不同的操作系统选择不同的安装包,下载完成后,将安装包解压到安装目录。注意:安装时,安装路径中不能含有空格。将scala安装目录下的bin目录加入到PATH环境变量:SCALA...原创 2019-06-07 23:38:28 · 439 阅读 · 0 评论