自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hadoop集群安装

Hadoop分布式文件系统 海量数据的存储NameNode 集群中的主节点,用来管理元数据(文件属性信息)DataNode 集群中的从节点,用来管理文件块SecondaryNameNode 集群中的辅助节点,用于NameNode的存储优化和数据恢复。

2024-01-03 14:09:43 757

原创 Hive安装学习

Hive是一个建立在Hadoop之上的数据仓库基础设施,它提供了类似于SQL查询语言(称为HiveQL)的接口,用于处理和分析大规模的结构化数据。Hive是Hadoop生态的数据仓库工具 Hive将存储在HDFS上的文件映射为关系表 通过解析开发者提交的SQL语句,将SQL转换成MR任务,提交到Hadoop执行 Hive提供了命令行客户端和JDBC下面是一些Hive的概念:表(Table):在Hive中,数据被组织成表的形式。每个表都有一个名称和一系列的列,每列都有对应的数据类型。

2024-01-03 14:02:18 843 1

原创 yarn框架学习记录 MapReduce阶段学习

作业调度与集群资源管理的框架。

2023-12-28 16:57:50 930

原创 MapReduce学习记录

在MapReduce中,。它允许你在处理大规模数据时进行连接操作,类似于关系型数据库中的JOIN操作。

2023-12-26 15:29:43 362 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除