大数据相关知识

需要了解的内容:

  • spark调优
  • hadoop2.0 基本原理
  • node manager、work
  • 怎么启动一个hadoop集群
  • 文件/数据传输到hdfs的过程
  • stage、job、task、driver、master、worker、DAGscheduler、taskscheduler、executor的关系
  • spark1和spark2的区别
  • 读文件(RDD格式/dataframe格式)
  • transformation操作、action操作
  • RDD的窄依赖、宽依赖

1. spark有关知识

1. spark常用函数:transformation和action

https://blog.csdn.net/dengjiaxing0321/article/details/73655744

2. spark中task的生成:

Spark中关于并发度涉及的几个概念File,Block,Split,Task,Partition,RDD以及节点数、Executor数、core数目的关系。

https://www.zhihu.com/question/33270495?sort=created

3. Spark的Job、Stage、Task是按何种规则产生的

https://blog.csdn.net/gaopu12345/article/details/79156675

4. spark中job,stage,task之间的关系(基本概念)

https://blog.csdn.net/mys_35088/article/details/80864092

5. 更多相关参考链接:

https://blog.csdn.net/JackLi31742/article/details/83895349

2. HashMap的实现

详细版:https://blog.csdn.net/mrzhoug/article/details/51197641

容易理解版:https://blog.csdn.net/mrzhoug/article/details/51197641

https://blog.csdn.net/uhgagnu/article/details/54982960

HashMap的面试题你能回答几个?https://blog.csdn.net/koolfret/article/details/78651380

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值