Spark Local环境基本原理

Local模式是Spark用于本地开发测试的选项,通过在一个JVM进程中使用多个线程来模拟分布式计算环境。Local[N]模式可根据CPU核心数设置线程数,N默认为1,若设为*,则使用所有逻辑核心。这种模式方便开发者快速验证应用逻辑,有效利用计算资源。
摘要由CSDN通过智能技术生成

一、介绍

Local模式就是常用于本地开发测试,本地还分为local单线程和local-cluster多线程;

二、本质

启动一个JVM Process进程(一个进程里面有多个线程),执行任务Task

三、原理

  • 该模式被称为**Local[N]**模式,是用单机的多个线程来模拟Spark分布式计算,直接运行在本地,便于调试,通常用来验证开发出来的应用程序逻辑上有没有问题。

  • 通常Cpu有几个Core,就指定几个线程,最大化利用计算能力.

  • 其中N代表可以使用N个线程,每个线程拥有一个cpu core。如果不指定N,则默认是1个线程(该线程有1个core)。

  • 如果是local[*],则代表 Run Spark locally with as many worker threads as logical cores on your machine.按照Cpu最多的Cores设置线程数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值