尚硅谷—大数据—Spark

本文介绍了Spark作为一款快速、通用的大数据分析引擎,对比了它与Hadoop的区别,包括处理速度和资源需求。Spark利用内存计算,提供更快的数据处理。文章还概述了Spark的核心模块,并提供了创建Maven项目的步骤,帮助读者快速上手Spark开发。
摘要由CSDN通过智能技术生成

一:简介:

        1)简介:
                a:Spark 是一种基于内存的、快速的、通用的、可拓展的、大数据分析 计算引擎。


        2)Spark VS Hadoop:
                a:从时间节点看变化:



                b:从功能来看区别:





                c:Spark or Hadoop:
                          -1.Hadoop 的 MR 框架 和 Spark 框架,都是数据处理框架,那我们在使用时该如何使用呢?
                                 a:Hadoop:


                                 b:Spark:

                                 c:实际使用选择:


                          -2.何所为 一次性数据计算:
                                 a:框架在 处理数据的时候,会从 存储设备中读取数据,进行逻辑操作,
                                          然后将处理的结果,重新存储到介质中。


                                 b:Hadoop 把结果 存储到 磁盘中:



                                 c:Spark 把结果 存储到 内存中:(处理速度快,堆内存资源要求高)(适合 单独部署)








 

二:Spark 核心模块 介绍:

        1)图示:



        2)模块介绍:







 

三:Spark 快速上手:

        1)创建 Maven 项目:
                a:增加 Scala 插件:

                b:

                c:
                d:
                e:

        2):
                a:
                b:
                c:
                d:
                e:

        3):
                a:
                b:
                c:
                d:
                e:

        4):
                a:
                b:
                c:
                d:
                e:

        5):
                a:
                b:
                c:
                d:
                e:

四::

        1):
        2):
        3):
        4):
        5):

                a:
                b:
                c:
                d:
                e:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值