大数据
zjxdxnl
这个作者很懒,什么都没留下…
展开
-
Hadoop:技术生态体系
tips:MapReduce是基于硬盘的离线计算 SparkCore是基于CPU的内存计算原创 2024-03-19 11:24:16 · 320 阅读 · 1 评论 -
Hadoop
tips:大数据的海量、快速、高效、低价值eg:查找数据的基本原理。实现并行。原创 2024-03-19 11:08:32 · 321 阅读 · 1 评论 -
Hadoop:解决海量数据的存储和计算
map join: MAPJION会把小表全部加载到中,在map阶段直接拿另外一个表的数据和内存中表数据做匹配,由于在map端是进行了join操作,省去了reduce运行的时间,算是hive中的一种优化。原创 2024-03-18 21:24:22 · 499 阅读 · 0 评论 -
Hive(1)
主要功能:支持海量数据的处理。原创 2024-03-18 13:28:37 · 285 阅读 · 0 评论