1. hive元数据库
- hive创建一张表,关联HDFS上存储的结构化数据,那么这张表存储在哪里?
其实hive会把用户创建的数据库表等抽象的信息专门存储在一个数据库中,这个数据库就是-------元数据库。 - HDFS存储的数据有两种:
①用户的真实数据,存储在datanode中
②抽象和管理这些真实数据的数据,叫做元数据,存储在namenode中
namenode类比于书本的目录,datanode类比于书本的内容,书本的内容存储的是真实的数据,而目录(元数据,管理数据的数据)可以翻到这一页内容(真实数据)。 - hive创建的数据库或者数据表,对应存储在元数据库不是一个数据库和一张表,而是一条条的记录。(下面的实操会更好理解)
- 我们在安装hive的时候,只需要对元数据库初始化一次就可以,初始化第二次会把第一次创建出来的元数据库覆盖。
2. hive实操
-
创建一个文件,写入数据
vim students.txt
-
在HDFS上创建一个目录,将students.txt文件上传到HDFS
hadoop fs -mkdir -p /student1029/input
hadoop fs -put /本地文件目录/students.txt /student1029/input