Hive元数据库中各个表的含义(十)

1. 前言

在之前找BUG的过程中,查看了元数据库中的DBS表和SDS表,灰常滴感兴趣,所以逐个查了一下。

2. 如何访问元数据库中的表

  1. 首先进入mysql,然后选择使用所创建的元数据库
    在这里插入图片描述
  2. 然后查看总共有几个元数据表
    在这里插入图片描述
    可以清楚的看到总共有30几个表。

3. 分析各表作用

首先先来个简要分析:

表名作用
BUCKETING_COLS存储bucket字段信息,通过SD_ID与其他表关联
CDS一个字段CD_ID,与SDS表关联
COLUMNS_V2存储字段信息,通过CD_ID与其他表关联
DATABASE_PARAMS存储数据库的相关参数
DBS存储hive的database信息
FUNCS用户注册的函数信息
FUNC_RU用户注册函数的资源信息
GLOBAL_PRIVS存储全局变量
IDXS索引表,存储Hive索引相关的元数据
INDEX_PARAMS索引相关的属性信息
PARTITIONS分区记录,SD_ID,TBL_ID关联
PARTITION_KEYS存储分区字段,TBL_ID关联
PARTITION_KEY_VALS分区的值,通过PART_ID关联。与PARTITION_KEYS共用INTEGER_IDX来标示不同的分区字段
PARTITION_PARAMS存储某分区相关信息,包括文件数,文件大小,记录条数等PART_ID关联
PART_COL_PRIVS分区字段的权限信息
PART_COL_STATS分区字段的统计信息
PART_PRIVS分区的授权信息
ROLES角色表,和GLOBAL_PRIVS配合
SDS存储对应文件的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。TBLS表中的SD_ID与该表关联,可以获取Hive表的存储信息。
SD_PARAMS该表存储Hive存储的属性信息
SEQUENCE_TABLE存储sqeuence相关信息
SERDES存储序列化反序列化使用的类
SERDE_PARAMS序列化反序列化相关信息,通过SERDE_ID关联
SKEWED_COL_NAMES
SKEWED_COL_VALUE_LOC_MAP
SKEWED_STRING_LIST
SKEWED_STRING_LIST_VALUES
SKEWED_VALUES
SORT_COLS排序字段,通过SD_ID关联
TABLE_PARAMS表相关信息
TAB_COL_STATS
TBLS存储Hive表、试图、索引表的基本信息
TBL_COL_PRIVS
TBL_PRIVS
VERSION存储hive的版本信息

3. 详细分析

先分析之前用到的DBS表和SDS表吧:

  1. DBS表主要用于存储Hive中所有数据库的基本信息
    在这里插入图片描述
FieldTypeComment
DB_IDbigint(20)数据库ID
DESCvarchar(4000)数据库描述
DB_LOCATION_URIvarchar(4000)数据库HDFS路径
NAMEvarchar(128)数据库名
OWNER_NAMEvarchar(128)数据库所有者用户名
OWNER_TYPEvarchar(10)所有者角色
  1. SDS表
    在这里插入图片描述
FieldComment
SD_ID存储信息ID
CD_ID字段信息ID
INPUT_FORMAT文件输入格式
IS_COMPRESSED是否压缩
IS_STOREDASSUBDIRECTORIES是否以子目录存储
LOCATIONHDFS路径
NUM_BUCKETS分桶
OUTPUT_FORMAT文件输出格式
SERDE_ID序列化类ID
  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值