一般来说hadoop hdfs有12个盘,每个盘2~3T
yarn resourcemanager nodemanager 如果集群比较小 20个以下,resourcemanager可以放到某个datanode机器上
hdfs namenode datanode
nodemanager(占用cpu资源)和datanode(占用硬盘资源)同时部署一台机器,充分利用资源,另外有可能方便数据计算从本地取
oracle几千万数据放到hdfs,存成orc或parquet,使用presto或impala实现秒级查询,搜索用es
https://www.zhihu.com/question/35811067/answer/66508638