大数据之spark详解

目录

什么是spark:

 功能历史上和hadoop的区别:

spark的五大核心模块:

➢ Spark Core


什么是spark:

简单一点Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。属于mapreduce的加强版本,结合了其优点而且spark是可以将数据保存在内存中从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

 功能历史上和hadoop的区别:

首先从时间节点上来看 :
Hadoop
2006 1 月, Doug Cutting 加入 Yahoo ,领导 Hadoop 的开发
2008 1 月, Hadoop 成为 Apache 顶级项目
2011 1.0 正式发布
2012 3 月稳定版发布
2013 10 月发布 2.X (Yarn) 版本
Spark
2009 年, Spark 诞生于伯克利大学的 AMPLab 实验室
2010 年,伯克利大学正式开源了 Spark 项目
2013 6 月, Spark 成为了 Apache 基金会下的项目
2014 2 月, Spark 以飞快的速度成为了 Apache 的顶级项目
2015 年至今, Spark 变得愈发火爆,大量的国内公司开始重点部署或者使用 Spark
然后我们再从功能上来看 :
Hadoop 是由 java 语言编写的,在分布式服务器集群上存储海量数据并运行分布式
分析应用的开源框架
作为 Hadoop 分布式文件系统, HDFS 处于 Hadoop 生态圈的最下层,存储着所有
的 数 据 , 支 持 着 Hadoop 的 所 有 服 务 。 它 的 理 论 基 础 源 于 Google
TheGoogleFileSystem 这篇论文,它是 GFS 的开源实现。
MapReduce 是一种编程模型, Hadoop 根据 Google MapReduce 论文将其实现,
作为 Hadoop 的分布式计算模型,是 Hadoop 的核心。基于这个框架,分布式并行
程序的编写变得异常简单。综合了 HDFS 的分布式存储和 MapReduce 的分布式计
算, Hadoop 在处理海量数据时,性能横向扩展变得非常容易。
HBase 是对 Google Bigtable 的开源实现,但又和 Bigtable 存在许多不同之处。
HBase 是一个基于 HDFS 的分布式数据库,擅长实时地随机读 / 写超大规模数据集。
它也是 Hadoop 非常重要的组件。
Spark
Spark 是一种由 Scala 语言开发的快速、通用、可扩展的 大数据分析引擎
Spark Core 中提供了 Spark 最基础与最核心的功能
Spark SQL Spark 用来操作结构化数据的组件。通过 Spark SQL ,用户可以使用
SQL 或者 Apache Hive 版本的 SQL 方言( HQL )来查询数据。
Spark Streaming Spark 平台上针对实时数据进行流式计算的组件,提供了丰富的
处理数据流的 API
由上面的信息可以获知, Spark 出现的时间相对较晚,并且主要功能主要是用于数据计算,
所以其实 Spark 一直被认为是 Hadoop 框架的升级版。

spark的五大核心模块:

 

Spark Core
Spark Core 中提供了 Spark 最基础与最核心的功能, Spark 其他的功能如: Spark SQL
Spark Streaming GraphX, MLlib 都是在 Spark Core 的基础上进行扩展的
Spark SQL
Spark SQL Spark 用来操作结构化数据的组件。通过 Spark SQL ,用户可以使用 SQL
或者 Apache Hive 版本的 SQL 方言( HQL )来查询数据。
Spark Streaming
Spark Streaming Spark 平台上针对实时数据进行流式计算的组件,提供了丰富的处理
数据流的 API
Spark MLlib
MLlib Spark 提供的一个机器学习算法库。 MLlib 不仅提供了模型评估、数据导入等
额外的功能,还提供了一些更底层的机器学习原语。
Spark GraphX
GraphX Spark 面向图计算提供的框架与算法库。
然后我们主要学习这五大板块内容(更新中)

Spark Core

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

新城已无旧少年_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值