spark原理博客

spark积累主要包括三方面

1、用起来:目前spark sql、pyspark、struct streaming都比较易用,在自己的业务场景先用起来,再逐步的优化

2、视野及场景提高:可以关注类似spark submit、中国数据库技术大会、hbase中国社区相关的 topic,看看其他公司都怎么使用的;另外需要关注spark和其他组件的配合使用,类似hbase、mongo、solr等

3、spark本身原理:可以关注spark每个版本的release note、hbase中国社区的相关问答。另外推荐几个比较好的原理博客

https://github.com/JerryLead/SparkInternals

https://github.com/jaceklaskowski/mastering-spark-sql-book

https://github.com/jaceklaskowski/spark-structured-streaming-book

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值