SQL
入门课程:https://www.codecademy.com/learn/learn-sql
入门资料:http://www.w3school.com.cn/sql/
实践:http://www.mysqltutorial.org/
入门阶段,跟着敲一遍就好。实践部分建议把 basic 的过一遍。
Spark
官网:Spark Overview,需要注意的是选择哪个版本,一般就选最新的吧
Spark repo:apache/spark,官方仓库,配合上面的讲解,敲一遍下来,主要是examples/src/main/scala/org/apache/spark/examples/这个目录下的例子
博客:Jacek Laskowski,大佬给我推荐的
Scala
A Tour of Scala 这个比较基础
Scala Exercises 这个内容还是挺多的,到现在还没敲完
基本上把上面两个网站撸完,Scala就差不多了。scala还是和Python挺像的。
为什么要学Scala,因为不想用Python去写Spark
怎么学
首先需要掌握的就是SQL语法和Scala语法,然后就跟着官网案例去敲代码,了解RDDs,DataFrame、Datasets的基本操作。如果公司有实际项目,跟着过一遍,就会好很多,我现在就处于这个阶段,欢迎和我交流。
我会把学习Spark的过程都放在这个repo里:learning-spark
微信没链接,可以在阅读原文中找到