- 博客(3)
- 收藏
- 关注
原创 数分岗之Hadoop和Hive常见面试题分享
4.对数据的权限不同: 程序员对内部表数据有绝对控制权,但对外部表数据没有控制权。数据库是面向事务做增删改查,数据仓库面向主题做数据分析,数据库为捕获数据而设计,数据仓库是为分析数据而设计,数据库存储业务数据,数据仓库存储历史数据,数据库设计要避免冗余,数据仓库设计有意引入冗余。NameNode(主节点):负责数据存储的管理,管理从节点,存储数据相关的元数据,响应客户端请求,主节点也可以被设置为从节点存储真实数据。2.数据仓库层(DW):DW层的数据应该是一致的、准确的、干净的数据,即进行了清洗后的数据。
2024-08-12 16:33:53 816
原创 Hadoop3.X框架下组件详解
Hadoop是一个由Apache基金会所开发的分布式系统基础架构,Hadoop框架下有三个核心组件–HDFS、MapReduce和Yarn。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算,Yarn为HDFS和MapReduce提供资源调度。
2024-08-07 18:31:09 431
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人