- 博客(2)
- 收藏
- 关注
原创 HDFS、YARN、MapReduce概述及三者之间的关系(图解)
HDFS(Hadoop Distributed File System) 是一种分布式文件系统,用于处理在商业硬件上运行的大型数据集。它用于将单个 Apache Hadoop 集群扩展到数百 (甚至数千)个节点。HDFS 是的主要组件之一,其他组件包括MapReduce和 YARN。HDFS的使用场景:适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变。MapReduce是一种分布式计算框架。
2024-01-20 22:36:34 2862
原创 HiveSQL分区的作用及创建分区表案例演示(图解)
本篇文章主要介绍HiveSQL分区表的作用和如何创建单级分区表和多级分区表以及查询规则等.
2024-01-13 18:01:10 3247 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人