Spark学习之路——1.初识Spark

最新推荐文章于 2020-02-03 16:29:06 发布

Nelson_hehe

最新推荐文章于 2020-02-03 16:29:06 发布

阅读量210

点赞数 1

分类专栏： # Spark 文章标签：基本概念 Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hehe_soft_engineer/article/details/103448813

版权

Spark 专栏收录该内容

9 篇文章 4 订阅

订阅专栏

第一节、初识Spark

一、Spark简介

1.Spark官网： http://spark.apache.org/

官方介绍为：Apache Spark™ is a unified analytics engine for large-scale data processing.

2.对Spark的总结

Spark是Apache的开源项目（一种灵活的框架），专为大规模数据处理（批处理、流计算、交互式计算）而设计的快速计算引擎。

3.Spark对比MapReduce

(1)Mapreduce局限性：

①仅支持map和reduce操作，编程简单但是代码量大

②处理效率较低：Map中间结果会写入磁盘，多个MapReduce之间通过HDFS进行交换数据；Map和Reduce端均进行排序；任务调度和启用的开销较大。

③不适合迭代计算（例如对机器学习和图计算等），交互式处理（数据挖掘）和流处理等。

④编程不灵活。

(2)Spark的优势

Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

Spark支持批处理计算、迭代计算（复杂算法）、交互式计算（支持类SQL语句，能快速进行数据分析）和流式计算（对数据进行实时处理分析）。

二、Spark生态

1.总的来说：

2.Spark向下支持YARN、Mesos、Kubernetes等资源管理框架，可以从HDFS、HBase、Hive等数据源访问数据。

3.Spark向上支持SQL、Streaming、MLlib、GraphX等计算方式。

三、Spark特点

1.计算速度快

①内存计算，提供了Cache机制来支持反复迭代的计算，减少数据读取的IO开销

②DAG引擎，计算的中间结果不会存储在磁盘里

③使用多线程池来减少task开销，shuffle阶段避免了不必要的sort操作，减少磁盘IO操作

2.支持多种语言（java，scala、Python、R）

3.一个框架支持多种计算

4.运行环境多样

①集成于Hadoop，支持多种数据源（上面提到）

②可以和yarn集成，还可以运行在Mesos上（Yarn和Mesos是同级的）

③Spark也可以脱离Hadoop独立运行

下一章将继续学习Spark的核心内容

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark学习之路——1.初识Spark

第一节、初识Spark一、Spark简介1.Spark官网： http://spark.apache.org/ 官方介绍为：Apache Spark™ is a unified analytics engine for large-scale data processing.2.对Spark的总结 Spark是Apache的开源项目（一种灵活的框架），专为大规模数据...
复制链接

扫一扫

专栏目录

Nelson_hehe CSDN认证博客专家 CSDN认证企业博客

码龄6年

156: 原创

1052: 周排名

1万+: 总排名

12万+: 访问

: 等级

3405: 积分

825: 粉丝

1196: 获赞

89: 评论

1175: 收藏

私信

关注

热门文章

分类专栏

最新评论

考研系列-数据结构第六章：图（下）
小ᶻZ࿆: 这篇博文令人愉悦，文字生动动人，逻辑清晰紧凑。作者丰富运用例证和引文，加强了论述的可信度。语言精准，让人如临其境，领略作者的观点。整体阅读体验令人愉快，期待更多作者作品。
AI在音乐创作中的角色：创造还是毁灭？
勇敢滴勇: 写的很深入，仔细。博主的文章让我对这个主题有了全新的认识，细节描写非常到位，期待博主未来能够持续分享更多好文，同时也希望能够得到博主的指导，共同进步！同时也希望可以来我博客指导我一番
AI在音乐创作中的角色：创造还是毁灭？
小ᶻZ࿆: 博主的文章一直都是我的学习指南，内容详实，让我从中获益良多，每篇博文都是知识的瑰宝，我真的很喜欢你的风格，你的博客内容深入浅出，总是让我不再感到学习的困难，期待你的下一次精彩分享。
AI在音乐创作中的角色：创造还是毁灭？
小码农叔叔: 感谢博主分享的知识，博主文章细节到位，兼顾操作性和实用性，文章思路清晰，干货满满，看完后受益匪浅，支持博主创作，期待博主未来的好文分享！
AI在音乐创作中的角色：创造还是毁灭？
邂逅岁月: 笔墨间融诗意深，绘画之术凌九天。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。