idea搭建scala环境_阿里P8专家,深入解析分布式计算:Strom+Scala+Spark,共15.93G

前言

今天给大家分享的是Spark体系之分布式计算:Strom,Scala,Spark的技术分享,希望大家能够喜欢!

主要内容

Strom

Storm是分布式实时计算系统,用于数据的实时分析、持续计算,分布式RPC等。

36621fd46ffd4edc96cafcfb0be537ea

storm架构结构

Scala

Scala是一种混合功能编程语言,类似java,运行于JVM,集成面向对象编程和函数式编程的各种特性。
(1)Scala可以与Java互操作:它用scalac这个编译器把源文件编译成Java的class文件,从Scala中调用所有的Java类库,也同样可以从Java应用程序中调用Scala的代码
(2)Spark是专为大规模数据处理而设计的快速通用的计算引擎,而spark就是scala编写的。
(3)对比Groovy和Scala:Groovy的优势在于易用性以及与Java无缝衔接,Scala的优势在于性能和一些高级特性

数据类型

026bcb5c24244e66bc7eedbe1ef78a28

Spark

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架,Spark拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

4233991f4f8248f7b55d63b33c165b48

(1)Spark是Scala编写,方便快速编程。
(2)Spark与MapReduce的区别
都是分布式计算框架,Spark基于内存,MR基于HDFS;
Spark处理数据的能力一般是MR的十倍以上;
有DAG有向无环图来切分任务的执行先后顺序;
(3)Spark运行模式
Local:多用于本地测试,如在eclipse,idea中写程序测试等。
Standalone:Standalone是Spark自带的一个资源调度框架,它支持完全分布式。
Yarn:Hadoop生态圈里面的一个资源调度框架,Spark实现了AppalicationMaster接口,所以可以基于Yarn来计算的,国内用yarn的多。
Mesos:资源调度框架,国内用的少。

Spark、Strom、Scala学习思维导图

5a2a427d14fe4b758fe9c3736a44fa0a
f61597686ae4409387d7d96788eea695
3711a79a9e6b494b9f9242a07539a2be

Spark、Strom、Scala学习视频(资料+笔记+代码+作业)路线

Strom

01 应用场景 架构模型 伪分布式与全分布式搭建

5ea5fa895dcd4c8fb743f27f88ecbe78

02 异步与同步时时分析框架与源码和实例

c69a34c84a924e70ae4baae9ff451572

03容错 事务和项目案例

a5472d6c836f4462a57a92d8ba8f16a2

Spark

1.Scala语言特点,基础用法,类型推断,函数式编程,特质特性,模式匹配,样例类,偏函数

551406239c1d4fe38fc7245d7f055c91

2.Scala隐式转换类型,Actor通信模型,Actor通信模型案例,Scala版本Spark-WordCount

6ff428ca5d6f424fbbc5bd1cf83e2800

Scala

1.初识Spark,Spark编程核心RDD,Spark算子类别详解,Spark算子Java+Scala 版本实现

fce46abd9d304660ae6bc61e743f9090

2.Spark持久化算子,Spark集群搭建,Spark基于Yarn任务提交,Spark基于Standalone+Yarn任务提交流程详解

90227d6cad344570802abaceb9536aab

3.SparkRDD的宽窄依赖,pipeline计算模型,资源调度与任务调度过程,PVUV案例,Spark任务提交参数详解

8e20b22fd39146bd9a1f1f1290f53180

4.Spark源码之Master启动、Driver注册、Application注册、Master划分资源、Executor启动、任务调度

4dbf08f53875492c9772b1c22662fc67

5.广播变量,累加器原理,SparkWEBUI,SparkMasterHA搭建,Spark日志管理配置,SparkShuffle详解

f499025bceca42cea1b976335e65fb94

6.SparkSQL之UDAF函数详解,开窗函数,初始SparkStreaming,SparkStreaming读取数据详细过程原理及算子操作

376d07a583ac4e03bfe52e0bb48830e1

7.Kafka分布式消息系统原理,SparkStreaming与Kafka整合的问题及策略,手动维护kafka 消费者offset

fe31bedd520c4aec9f233109ba1a0af1

Spark、Strom、Scala学习视频(资料+笔记+代码+作业)大集合

b2da872c22a74d7f9f02d8359292d842

到此就整理完了,也就不浪费大家的时间了,需要获取的同学就可以转发+关注小编,私信小编“学习”来得到获取方式了。

感谢大家的支持,还请大家多多指教。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值