spark学习总体

最新推荐文章于 2024-06-14 14:09:48 发布

一只学技术的狮子

最新推荐文章于 2024-06-14 14:09:48 发布

阅读量103

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44786007/article/details/104495799

版权

spark 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

spark总体体系学习

scala语言学习
spark基础操作（spark基础，spark core，spark sql，spark streaming）
高级（spark内核机制、spark性能调优）

spark是一种基于***内存 ***的快速、通用、可扩展的大数据分析引擎。

**

Spark的运行模式

**

集群角色：
master和works；Driver和Executor
Driver（驱动器）负责的任务（main方法进程）：
（1）把用户程序转为任务；
（2）跟踪Executor的运行状况
（3）为执行器节点调度任务
（4）UI展现运行状况
Executor（执行器）：
（1）负责运行组成spark应用的任务，并将结果返回给驱动进程；
（2）通过自身的块管理器为用户程序中要求缓存的RDD提供内存式存储。RDD是直接缓存在Executor进程内，因此任务可以载运行时充分利用缓存数据加速运算。
在这里插入图片描述
Local模式
本地模式，本机练手和测试，
local[*]:这种模式直接按照cpu的最多核心数

安装spark
在这里插入图片描述
下载spark-2.1.1-bin-hadoop2.7.tgz
国内下载比较慢，可以搭个梯度爬出去。。。。。

下载好了之后解压到自己要放的目录下

bin目录下是操作指令，sbin目录下是启动关闭指令

可以rm -rf *.cmd
cmd在linux中一点用也没有

一只学技术的狮子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。