Hive元数据

1、Hive元数据的概念及存储方式

(1)元数据是描述真实数据的数据,包括Hive表的数据库名、表名、字段名与类型等

(2)Hive元数据存储在RDBMS中,有三种存储模式:

单用户模式,使用内置Derby数据库

多用户模式,使用本地MySQL数据库

远程服务模式,使用远程元数据服务访问数据库

2、Hive元数据——单用户模式存储

(1)元数据存储在Derby数据库,是默认的存储方式

(2)单用户存储模式的优缺点:

优点:Derby小巧易用,安装方便

缺点:在同一数据库目录下只能有一个Hive客户端使用,无法实现元数据共享

(3)单用户存储模式适合在测试环境中使用

3、Hive元数据——多用户模式存储

(1)元数据存储在MySQL数据库,是开发中经常使用的存储模式

(2)多用户模式存储的配置

4、Hive元数据——远程服务模式存储

(1)单独开启metastore服务,通过metastore服务访问元数据库(如MySQL)

(2)配置启动远程服务模式存储

5、Hive主要元数据表介绍

元数据表名(MySQL hive数据库中)说明
VERSION存储Hive版本

DBS、DATABASE、PAPAMS

存储与Hive数据库相关信息
TBLS、TABLE_PAPAMS、TBL_PRIVS存储Hive表相关信息
SDS、SD_PARAMS、SERDES、SERDES_PARAMS存储Hive文件存储相关信息
PAPTITIONS、PATITION_KEYS、PARTITION_KEY_VALS、PARTITON_PARAMS存储分区相关信息
COLUMNS_V2存储表对应的字段信息
CDS记录Columns_v2中所有的CD_ID
DB_PRIVS数据库权限信息表
IDXS索引表
TBL_COL_STATS表字段统计信息
TBL_COL_PRIVS表字段授权信息
PAPT_PRIVS分区授权信息

5.1 VERSION表

  • 包括主键ID、Hive版本及版本说明
  • 有且只有一条数据

5.2 DBS表

元数据表字段说明示例数据
DB_ID数据库ID26
DESC数据库描述雇员数据库
DB_LOCATION_URL数据库HDFS路径hdfs://cluster1/home/....../empdb.db
NAME数据库名empdb
OWNER_TYPE所有者类型USER
OWNER_NAME 数据库所有者root

5.3 DATABASE_PARAMS表

存储数据库的相关参数

元数据表字段说明示例数据
DB_ID数据库ID26
PARAM_KEY参数名

createdby

PARAM_VALUE参数值

root

5.4 TABLE_PARAMS表

存储表/视图的额外属性信息

元数据表字段说明示例数据
TBL_ID表ID694
PARAM_KEY参数名transient_lastDdlTime
PARAM_VALUE参数值1544065674

5.5 TBLS_PRIVS表

存储Hive表/视图的授权信息

元数据表字段说明示例数据
TBL_GRANT_ID授权ID1
CREATE_TIME授权时间1544065674
GRANT_POTION被授权者可授权给其他用户0
GRANTOR授权执行用户root
GRANTOR_TYPE授权者类型USER
GRANTOR_NAME被授权用户username
PRINCIPAL_TYPE被授权用户类型USER
TBL_PRIV权限select、alter
TBL_ID表ID694

5.6 PARTITIONS表

存储表分区的基本信息

元数据表字段说明示例数据
PART_ID分区ID1
CREATE_TIME分区创建时间1544065674
LAST_ACCESS_TIME最后一次访问时间0
PART_NAME分区名year=2018
SD_ID分区存储信息ID696
TBL_ID表ID695

  • 37
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值