- 博客(4)
- 收藏
- 关注
原创 Hadoop集群安装
Hadoop分布式文件系统 海量数据的存储NameNode 集群中的主节点,用来管理元数据(文件属性信息)DataNode 集群中的从节点,用来管理文件块SecondaryNameNode 集群中的辅助节点,用于NameNode的存储优化和数据恢复。
2024-01-03 14:09:43 757
原创 Hive安装学习
Hive是一个建立在Hadoop之上的数据仓库基础设施,它提供了类似于SQL查询语言(称为HiveQL)的接口,用于处理和分析大规模的结构化数据。Hive是Hadoop生态的数据仓库工具 Hive将存储在HDFS上的文件映射为关系表 通过解析开发者提交的SQL语句,将SQL转换成MR任务,提交到Hadoop执行 Hive提供了命令行客户端和JDBC下面是一些Hive的概念:表(Table):在Hive中,数据被组织成表的形式。每个表都有一个名称和一系列的列,每列都有对应的数据类型。
2024-01-03 14:02:18 843 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人