1.归纳法:
对标与参考
适配与裁剪
2..术法道,深入源码体系
先分析该系统是数据存储还是计算系统。
如果是数据存储系统,从数据分布和副本策略开始入手
哈希:ElasticSearch
范围:HBase
数据量:HDFS
一致性:Cassan
副本读取
副本更新
副本切换
如果是数据处理问题,从数据投递策略入手。
离线
实时
微批
at most once
at least once
exactly once2 .读对应系统架构图,对应着常用的架构模型,每个组件和已有的系统进行类比,想一下这个组件类似于hdfs的namenode等等,最后在脑海里梳理下数据流的整个流程。
3.在了解了系统的大概,着重看下文档中fault tolerence章节,看系统如何容错,或者自己可以预先问些问题,比如如果一个节点挂了、一个任务挂了系统是如何处理这些异常的,带着问题看文档。
4.文档详细读了一遍,就可以按照官方文档写些hello world的例子了,详细查看下系统配置项,随着工作的深入就可以看些系统的细节和关键源码了。
转自:https://blog.csdn.net/tg229dvt5i93mxaq5a6u/article/details/78266424