Spark学习资源整合(持续更新)

转载 2016年08月29日 22:34:40
一、为什么学习Spark

  大数据技术快速发展,Spark为Hadoop大数据技术生态体系带了新的活力与技术革新。至于为什么学习Spark,这样的问题真的是一千个人心中有一千个哈姆雷特。Spark的官网告诉我们:Apache Spark™ is a fast and general engine for large-scale data processing.而其独特魅力已经在疯狂地影响从事大数据领域的IT修炼者,值得我们一窥究竟。

Speed
Run programs up to 100x faster than Hadoop MapReduce in memory, or 10x faster on disk. 
Apache Spark has an advanced DAG execution engine that supports cyclic data flow and in-memory computing.

Ease of Use
Write applications quickly in Java, Scala, Python, R. 
Spark offers over 80 high-level operators that make it easy to build parallel apps. And you can use it interactively from the Scala, Python and R shells.
 
Generality
Combine SQL, streaming, and complex analytics.Spark powers a stack of libraries including SQL and DataFrames, MLlib for machine learning, GraphX, and Spark Streaming. You can combine these libraries seamlessly in the same application.
 
 Runs Everywhere
Spark runs on Hadoop, Mesos, standalone, or in the cloud. It can access diverse data sources including HDFS, Cassandra, HBase, and S3.
    
二、Spark的学习资料整理

  在学习Spark的过程中发现互联网上有很多不错的资源/资料,给予了个人修炼技术提供了很大的帮助与指导。但之前一直没有时间梳理, 先以此日志来记录整理,后续再不断更新,方便自己和他人在Spark修炼路上查阅学习。

   2.1、【Spark相关技术博客汇总】
      2.1.1、过往记忆:https://www.iteblog.com/
      2.1.5、高彦杰:http://blog.csdn.net/gaoyanjie55
      2.1.6、saisai_shao:http://jerryshao.me/

   2.2、【Spark相关较好的Github资源】
      2.2.1、源码学习:https://github.com/apache/spark
      2.2.2、原理剖析:https://github.com/JerryLead/SparkInternals

本文转自AiTi修炼|大技术窥探 ,尊重原作者知识产权,转载已注明出处与连接。

RxJava学习资源整合

中国 RxJava 教父级人物,著名全栈 大头鬼BruceCSDN 博客:大头鬼Bruce Blog Pages:Bruce Lee’s Blog GitHub 主页:lzyzsd (Bruce ...
  • WiseClown
  • WiseClown
  • 2016年06月05日 14:16
  • 500

如何成为资源整合高手

从2000年到2010年这十年,我大部分时间都是每天16个小时在电脑前,天天学、天天干、自己亲手做的网站都有上百个,最后把自己整的想全能机器人似的,什么都会,结果很累,身心疲惫。 后...
  • yu736153523
  • yu736153523
  • 2016年06月25日 09:31
  • 1671

Marketing Case ----职场心得:关于资源整合!个人的体会

 对于在职场打拼多年的人来说,最重要的工作是积累各种资源:认识的人多积累的是人脉资源、认识的老板多是积累的是资金资源、操作的项目多积累的是经验资源。。。  资源的积累是“成事”的重要的环节,但也只是第...
  • windiy
  • windiy
  • 2007年01月18日 18:29
  • 3735

android学习资源大整合(持续更新ing)

今天抽空整理了下平常学习android常逛的网站(这样以后就可以从这里检索了,便于快速找到所需的资源),以及对我影响比较大的几位大牛的博客,希望对大家有所帮助,如果大家还有更好的学习资源也希望可以共享...
  • wdong_love_cl
  • wdong_love_cl
  • 2016年07月29日 12:42
  • 4303

Spark学习--持续更新

1、spark三种语言对比:使用scala是greate,python是nice,java是ugly。2、spark RDD(Resilient Distributed Datasets弹性分布式数据...
  • qq_27657429
  • qq_27657429
  • 2017年04月26日 17:19
  • 176

spark零基础学习路线指导

spark零基础学习路线指导 问题导读 1.你认为spark该如何入门? 2.你认为spark入门编程需要哪些步骤? 3.本文介绍了spark哪些编程知识?   s...
  • SCGH_Fx
  • SCGH_Fx
  • 2017年07月04日 13:56
  • 3371

为什么学习Spark?

讲到Spark,我们要先讲将大数据,因为Spark是一个处理大数据的平台。那什么是大数据呢?大数据也称为海量数据,通常都是指TG级、PB级的数据,但是随着时间的流逝和验证,一些人们对大数据也发生了观念...
  • book_mmicky
  • book_mmicky
  • 2014年05月13日 15:24
  • 2957

我的spark学习之路(一)

2016.8.10其实北京一年,我也一直在考虑我回所到底研究什么方向,但都只是停留在想想的层次,最终也没什么结果,回来老师问了我的想法说,学分布式计算吧,读博也可以,找工作也好找,文章也好发,我一想,...
  • xtfge0915
  • xtfge0915
  • 2016年08月10日 23:38
  • 5215

从零开始学习Spark--第2章 spark开发

1. 主要参考资料 http://spark.incubator.apache.org/docs/latest/scala-programming-guide.html http://www.ee...
  • u011539200
  • u011539200
  • 2013年12月04日 16:29
  • 6575

Spark修炼之道——Spark学习路线、课程大纲

课程内容 Spark修炼之道(基础篇)——Linux基础(15讲)、Akka分布式编程(8讲) Spark修炼之道(进阶篇)——Spark入门到精通(30讲) Spark修炼之道(实战篇)——Spar...
  • lovehuangjiaju
  • lovehuangjiaju
  • 2015年08月19日 19:58
  • 14046
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Spark学习资源整合(持续更新)
举报原因:
原因补充:

(最多只允许输入30个字)