db: myhive, table: student 元数据:hivedb
1、Hive的元数据
指的是 myhive 和 student等等的库和表的相关的各种定义信息
该元数据都是存储在mysql中的
myhive是hive中的一个数据库的概念,其实就是HDFS上的一个文件夹,跟mysql没有多大的关系
myhive是hive中的一个数据库,那么就会在元数据库hivedb当中的DBS表中存储一个记录
这一条记录就是myhive这个hive中数据的相关描述信息
其实,hive中创建一个库,就相当于是在hivedb中DBS中插入一条记录, 并且在HDFS上建立相应的目录
其实,hive中创建一个表,就相当于在hivedb中TBLS表中插入一条记录,并且在HDFS上项目的库目录下创建一个子目录
一个hive数据数据仓库就依赖于一个RDBMS中的一个数据库,一个数据库实例对应于一个Hive数据仓库
存储于该hive数据仓库中的所有数据的描述信息,都统统存储在元数据库hivedb中
myhive 和 hivedb的区别:
myhive是hive中的数据库: 用来存储真实数据
hivedb是mysql中的数据库: 用来多个类似myhive库的真实数据的描述数据
2、Hive的原数据
3、Hive的源数据
存储在hive数据仓库中的真实数据 student.txt
元数据 : 一定指跟 hivedb相关,跟mysql相关
数据: HDFS上的对应表的目录下的文件
HDFS上的数据和元数据
数据:block块
元数据:描述和管理这些block信息的数据, 由namenode管理