hive元数据分析

前言

在对hive SQL进行解析,以及跟踪hive job与yarn application的关系时,
还有对hive数据仓库进行数据治理时,需要对hive元数据有个较为清楚的认识,
进而更好的在解析SQL时,对数据访问进行权限控制;
在资源管理时,进行资源归属;
在数据生命周期管理时对其进行有效管理

hive元数据库、表

  • hive元数据是有mysql存储的,如果默认安装则是hive数据库,里面有一系列跟数据表、分区,数据倾斜,数据存储、压缩等相关的数据表

version

  • 存储hive版本信息
    在这里插入图片描述

database相关

dbs

  • 存储hive 数据库的hdfs目录,编号等信息
    在这里插入图片描述

DATABASE_PARAMS

  • 该表存储数据库的相关参数,在CREATE DATABASE时候用WITH DBPROPERTIES(property_name=property_value, …)指定的参数,会存在该表中;其主键以为dbs的主键

在这里插入图片描述

table 相关

tlbs

  • 存储hive数据表的所属库,owner,创建时间,最后访问时间[默认无效,需修改源码生效]等信息
    在这里插入图片描述

TABLE_PARAMS

  • 该表存储表/视图的属性信息,创建表时的tbl_properties
    在这里插入图片描述

TBL_PRIVS

-该表存储表/视图的授权信息
在这里插入图片描述

partions相关

partitions

  • 存储hive分区表的分区记录,访问时间,table_id等
    在这里插入图片描述

PARTITION_KEYS

-该表存储分区的字段信息
在这里插入图片描述

PARTITION_KEY_VALS

-该表存储分区字段值
在这里插入图片描述

PARTITION_PARAMS

-该表存储分区的属性信息
在这里插入图片描述

存储相关

SDS

  • 该表保存文件存储的基本信息,如输入、输出格式、压缩格式、是否压缩、序列化等信息。TBLS表中的SD_ID与该表关联,可以获取Hive表的存储信息。
    在这里插入图片描述

SD_PARAMS

  • 该表存储Hive存储的属性信息,在创建表时候使用STORED BY ‘storage.handler.class.name’ [WITH SERDEPROPERTIES (…)指定。
    在这里插入图片描述

SERDES

  • 该表存储序列化使用的类信息
    在这里插入图片描述

SERDE_PARAMS

  • 该表存储序列化的一些属性、格式等信息,比如:行、列分隔符
    在这里插入图片描述

其他

  • 其他有诸如 索引相关信息,数据倾斜,权限管理,分区统计、授权等,不一一赘述
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值