数仓开发常用技术汇总-基础篇(持续更新)
1.Hadoop1.1简介是什么:Hadoop是一个由Apache基金会所开发的分布式系统基础架构有什么用:使用户可以在不了解分布式底层细节的情况下,开发分布式程序屏蔽分布式底层细节,使得开发时无需考虑分布式底层的文件存储、资源调度、任务分配、结果汇总等细节1.2优劣高可靠行性:Hadoop底层维护多个数据副本,即使某个计算单元或存储出现故障,也不会导致数据的丢失高扩展性:Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便的扩展到数以千计的节点中高效性:Had






