Hive元数据信息对应的MySQL数据表

本文详细介绍了Hive元数据在MySQL中的存储方式,包括版本信息、数据库、表、视图、存储、字段、分区及权限等57张元数据表的结构与用途。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hive元数据信息对应的MySQL数据表

Hive的元数据一般选择放在关系型数据库中,自带的数据库是Derby,我将Hive的元数据信息存放在MySQL数据库中,对应的hive数据库中,共57张表。

1. Hive版本信息

元数据表VERSION中存储的是Hive的元数据版本,如果该表出现问题,根本进入不了Hive-Cli。

  • VERSION表结构:

    元数据表字段说明示例数据
    VER_IDID(主键)1
    SCHEMA_VERSIONHive-Schema版本2.3.0
    VERSION_COMMENT版本说明Hive release version 2.3.0

2. Hive数据库相关的元数据表

与Hive数据库相关的元数据表有3个,分别是DBSDATABASE_PARAMSDB_PRIVS这3张表。DBS存储的是Hive数据库的基本信息,DATABASE_PARAMS存储的是数据库的相关参数,DB_PRIVS存储的是数据库的授权信息,通过GRANT授权后将存储在这里表中(不常用)。

  • DBS表结构:

    元数据表字段说明示例数据
    DB_ID数据库ID51
    DESC数据库描述
    DB_LOCATION_URI数据库HDFS路径hdfs://supercluster/user/hive/warehouse/test.db
    NAME数据库名称test
    OWNER_NAME数据库所有者hadoop
    OWNER_TYPE数据库所有者类型USER

  • DATABASE_PARAMS表结构:

    元数据表字段说明示例数据
    DB_ID数据库ID51
    PARAM_KEY参数名date
    PARAM_VALUE参数值2020-09-02

  • DB_PRIVS表结构(不常用):

    元数据表字段说明示例数据
    DB_GRANT_ID授权ID1
    CREATE_TIME授权时间1599136358
    DB_ID数据库ID51
    GRANT_OPTION授权选项0
    GRANTOR授权用户hadoop
    GRANTOR_TYPE授权用户类型USER
    PRINCIPAL_NAME被授权用户hadoop
    PRINCIPAL_TYPE被授权用户类型USER
    DB_PRIV数据库权限SELECT

3. Hive表和视图相关的元数据表

与Hive数据表和视图相关的元数据表有3个,分别是TBLSTABLE_PARAMSTBL_PRIVS这3张表。TBLS存储的是Hive数据表、视图和索引表的基本信息,TABLE_PARAMS存储的是数据表和视图的属性信息,TABLE_PRIVS存储的是数据表和视图的授权信息。

  • TBLS表结构:

    元数据表字段说明示例数据
    TBL_ID数据表ID18
    CREATE_TIME创建时间1599139279
    DB_ID数据库ID51
    LAST_ACCESS_TIME上次访问时间0
    OWNER所有者hadoop
    RETENTION保留字段0
    SD_ID序列化配置信息18
    TBL_NAME表名studentview
    TBL_TYPE表类型VIRTUAL_VIEW
    VIEW_EXPANDED_TEXT视图的详细HQL语句SELECT `id` AS `id`, `name` AS `name`, `sex` AS `sex` FROM (select `student`.`id`, `student`.`name`, `student`.`sex` from `test`.`student`) `test.studentView`
    VIEW_ORIGINAL_TEXT视图的原始HQL语句select * from test.student
    IS_REWRITE_ENABLED0

  • TABLE_PARAMS表结构:

    元数据表字段说明示例数据
    TBL_ID数据表ID18
    PARAM_KEY属性名transient_lastDdlTime
    PARAM_VALUE属性值1599139279

  • TBL_PRIVS表结构:

    元数据表字段说明示例数据
    TBL_GRANT_ID授权ID61
    CREATE_TIME授权时间1599139279
    GRANT_OPTION授权选项1
    GRANTOR授权用户hadoop
    GRANTOR_TYPE授权用户类型USER
    PRINCIPAL_NAME被授权用户hadoop
    PRINCIPAL_TYPE被授权用户类型USER
    TBL_PRIV数据表权限UPDATE
    TBL_ID数据表ID18

4. Hive文件存储信息相关的元数据表

由于HDFS的文件格式很多,建Hive表的同时也可以指定各种文件格式,Hive在将SQL解析成MapReduce程序时,需要知道去哪里可以查询到这些信息,这些信息就保存在SDSSD_PARAMSSERDESSERDE_PARAMS这4张表中。SDS存储的是文件存储的基本信息,如输入格式、输出格式、是否压缩等,SD_PARAMS存储的是hive存储的相关属性,在创建表时使用,SERDES存储的是序列化使用的类信息,SERDE_PARAMS存储的是序列化的一些属性和格式信息,比如行、分隔符等。

  • SDS表结构:

    元数据表字段说明示例数据
    SD_ID存储信息ID2
    CD_ID字段信息ID2
    INPUT_FORMAT文件输入格式org.apache.hadoop.mapred.TextInputFormat
    IS_COMPRESSED是否压缩0
    IS_STOREDASSUBDIRECTORIES是否以子目录存储0
    LOCATIONHDFS路径hdfs://supercluster/user/hive/warehouse/test.db/student
    NUM_BUCKETS分桶数量-1
    OUTPUT_FORMAT文件输出格式org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
    SERDE_ID序列化类ID17

  • SD_PARAMS表结构:

    元数据表字段说明示例数据
    SD_ID存储信息ID
    PARAM_KEY属性名
    PARAM_VALUE属性值
  • SERDES表结构:

    元数据表字段说明示例数据
    SERDE_ID序列化类配置ID17
    NAME序列化类别名
    SLIB序列化类org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

  • SERDE_PARAMS表结构:

    元数据表字段说明示例数据
    SERDE_ID序列化类配置ID17
    PARAM_KEY属性名field.delim
    PARAM_VALUE属性值

5. Hive表字段相关的元数据表

元数据表COLUMNS_V2主要存储的是Hive数据表中字段的相关信息。

  • COLUMNS_V2表结构:

    元数据表字段说明示例数据
    CD_ID字段信息ID17
    COMMENT字段注释
    COLUMN_NAME字段名id
    TYPE_NAME字段类型int
    INTEGER_INDEX字段顺序0

6. Hive表分区相关的元数据表

和Hive表分区相关的元数据表主要有PARTITIONSPARTITION_KEYSPARTITION_KEY_VALSPARTITION_PARAMS这4张表。PARTITIONS表存储的是Hive表分区的基本信息,PARTITION_KEYS表存储的是Hive分区表的分区字段的信息,PARTITION_KEY_VALS表存储的是Hive表分区的字段值,PARTITION_PARAMS表存储的是Hive分区的属性信息。

  • PARTITIONS表结构:

    元数据表字段说明示例数据
    PART_ID分区ID1
    CREATE_TIME分区创建时间1599224944
    LAST_ACCESS_TIME最后一次访问时间0
    PART_NAME分区名dt=2020-09-03
    SD_ID分区存储ID21
    TBL_ID数据表ID19

  • PARTITION_KEYS表结构:

    元数据表字段说明示例数据
    TBL_ID数据表ID19
    PKEY_COMMENT分区字段注释
    PKEY_NAME分区字段名称dt
    PKEY_TYPE分区字段类型string
    INTEGER_IDX分区字段顺序0

  • PARTITION_KEY_VALS表结构:

    元数据表字段说明示例数据
    PART_ID分区ID1
    PART_KEY_VAL分区字段值2020-09-03
    INTEGER_IDX分区字段顺序0

  • PARTITION_PARAMS表结构:

    元数据表字段说明示例数据
    PART_ID分区ID1
    PARAM_KEY分区属性名numFiles
    PARAM_VALUE分区属性值1

7. 其他不常用的元数据表
  • IDXS:索引表;
  • INDEX_PARAMS:索引参数/属性表;
  • TAB_COL_STATS:表字段的统计信息表。使用ANALYZE语句对标字段分析后记录在这里;
  • TAB_COL_PRIVS:表字段的授权信息表;
  • PART_PRIVS:分区授权信息表;
  • PART_COL_STATS:分区字段的统计信息表;
  • PART_COL_PRIVS:分区字段的权限信息表;
  • FUNCS:用户注册的函数信息表;
  • FUNCS_RU:用户注册函数的资源信息表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Yanko24

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值