一、概念
Hive中有两类数据:表数据和元数据。和关系型数据库一样,元数据可以看做是描述数据的数据,包括1.hive表的数据库名、表名、字段名称与类型、分区字段与类型 2.表及分区的属性、存放位置等
元数据存储路径和內表一样,分为本地
和远程
,可通过hive-site.xml文件设置
二、元数据库信息
元数据库中存在以下这些表:
元数据ER图
元数据表结构详解看参见lxw的文章
三、如何查看元数据库中的信息
1. 通过元数据库MySQL客户端
2. 通过Hive客户端远程访问
通过Hive MetaTool读取表信息
HIVE_CONF_DIR=/etc/hive/conf/conf.server/ hive --service metatool -executeJDOQL 'select dbName+"."+tableName+"::"+colName+"="+numDVs from org.apache.hadoop.hive.metastore.model.MTableColumnStatistics';
HIVE_CONF_DIR=/etc/hive/conf/conf.server/ hive --service metatool -executeJDOQL 'select dbName+"."+tableName+"("+partitionName+")::"+colName+"="+numDVs from org.apache.hadoop.hive.metastore.model.MPartitionColumnStatistics';