1.我有一万个元素(比如数字或单词)需要存储?
如果查找某一个元素,最简单的遍历方式复杂的是多少?
如果我期望复杂度是O(4)呢?
2.有一个非常大的文本文件,里面有很多很多的行,只有两行一样,它们出现在未知的位置,需要查找到它们。
3.2000台真的比一台速度快吗?
如果考虑分发上传文件的时间呢?
如果考虑每天都有1T数据的产生呢?
如果增量了一年,最后一天计算数据呢?
4.分布式文件系统那么多,为什么hadoop项目中还要开发一个hdfs文件系统?
5.hdfs的存储模型。
6.hdfs的架构设计。
7.hdfs的角色功能。
8.hdfs的元数据持久化。
9.hdfs的安全模式。
10.hdfs的snn。
11.hdfs中的Block的副本放置策略。
12.hdfs的写流程。
13.hdfs的读流程。
14.hadoop集群的三种方式。
15.hadoop集群搭建里ssh免密是为了什么?
16.hadoop集群搭建ha模式。
17.Paxos算法。
18.hadoop的Federation。
19.hdfs超级用户。