实践数据湖iceberg 第五课 hive catalog特点

最新推荐文章于 2025-11-13 05:35:57 发布

原创

最新推荐文章于 2025-11-13 05:35:57 发布 · 2.5k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#hive #big data #hadoop

本文通过实战演示了如何使用HiveCatalog结合Iceberg表格式进行数据操作，包括创建目录、表结构、写入数据及查看元数据的变化。

系列文章目录

@[TOC](文章目录)

前言

不以完美记录做为目标。以记录自己学习过程为主线，进行记录，记录通过实践，来了解原理，并把这个实践过程分享给后来需要学习的同学。

本节：了解hive catalog与hadoop catalog的区别，进行认识

1. 建立 hive catalog，建表

创建hive_catalog与表

CREATE CATALOG hive_catalog4 WITH (
  'type'='iceberg',
  'catalog-type'='hive',
  'uri'='thrift://hadoop101:9083',
  'clients'='5',
  'property-version'='1',
  'warehouse'='hdfs:////user/hive/warehouse/hive_catalog4'
);

在hive_catalog下创建数据库
use catalog hive_catalog4;
 
 
CREATE TABLE `hive_catalog4`.`default`.`sample` ( id BIGINT COMMENT 'unique id', data STRING );

2. 查看hdfs

[root@hadoop101 ~]# hadoop fs -ls -R

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

*星星之火*

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Hive基础】-- Hive Catalog

欢迎来到我的博客，一起探索代码里的世界！

03-28

1101

2.2 Hive Catalog 的组成部分。4.3 Hive Catalog 的性能优化。4.2 Hive Catalog 的自定义。1.2 Hive Catalog 的作用。2.Hive Catalog 的基础知识。2.1 Hive Catalog 的类型。2.3 Hive Catalog 的架构。4.1 Hive Catalog 的扩展。5.1 Hive Catalog 的优势。5.2 Hive Catalog 的不足。5.3 Hive Catalog 的未来。3.2.1 HCatalog 的作用。

【大数据入门核心技术-Iceberg】（十）Iceberg与Spark整合，并默认使用hive的catalog

06-14

352

本文介绍了Iceberg与Spark整合的配置与测试方法，包括环境准备、核心配置参数调整以及简单测试验证。首先需完成Iceberg的安装部署，然后在Spark中配置Iceberg相关参数，如catalog类型、仓库路径等。通过执行Spark SQL操作测试Iceberg表创建、数据写入和查询功能，验证整合是否成功。该过程为大数据环境下使用Iceberg构建数据湖提供了实践指导。

4 条评论您还未登录，请先登录后发表或查看评论

4 条评论

YueBanWa 2022.07.22
这个是在hive里面创建？
- wu_zhjian回复*星星之火* 2023.06.28
  这种建表方式，写入的数据，用hive直接查询是否能查到？我使用hive catalog，flink 建表写入数据后，hive查不到数据
- Panny范回复YueBanWa 2023.03.31
  flink-sql 语法，hive不支持这种语法
- *星星之火*回复YueBanWa 2022.07.25
  flink-sql客户端