spark学习总体

spark总体体系学习

  1. scala语言学习
  2. spark基础操作(spark基础,spark core,spark sql,spark streaming)
  3. 高级(spark内核机制、spark性能调优)

spark是一种基于***内存 ***的快速、通用、可扩展的大数据分析引擎。

**

Spark的运行模式

**

集群角色:
master和works;Driver和Executor
Driver(驱动器)负责的任务(main方法进程):
(1)把用户程序转为任务;
(2)跟踪Executor的运行状况
(3)为执行器节点调度任务
(4)UI展现运行状况
Executor(执行器):
(1)负责运行组成spark应用的任务,并将结果返回给驱动进程;
(2)通过自身的块管理器为用户程序中要求缓存的RDD提供内存式存储。RDD是直接缓存在Executor进程内,因此任务可以载运行时充分利用缓存数据加速运算。
在这里插入图片描述
Local模式
本地模式,本机练手和测试,
local[*]:这种模式直接按照cpu的最多核心数

安装spark
在这里插入图片描述
下载spark-2.1.1-bin-hadoop2.7.tgz
国内下载比较慢,可以搭个梯度爬出去。。。。。

下载好了之后解压到自己要放的目录下

bin目录下是操作指令,sbin目录下是启动关闭指令

可以rm -rf *.cmd
cmd在linux中一点用也没有

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值