元数据信息存储
- hive的元数据信息,就是创建的库,表,列等信息
- 这些信息需要一个外部的关系型数据库来保存,这样每次启动hive时,才能知道hive下有哪些元数据信息。目前的hive只支持 derby,mysql两种关系型数据库
- 启动hive时,默认会启动内置的关系型数据 derby,用来读取和保存元数据信息,使用derby有两大弊端:
在哪个目录启动hive,则会在当前目录下创建一个文件,用来存储元数据信息。这导致在不同的目录下启动hive,没法找到以前在其他目录创建的库和表等信息
当启动hive时,会去当前目录下读取元数据信息的文件,并占用该资源。若其他人想使用hive,则没法占用该文件,导致启动hive报错。使得hive只支持单用户。
安装mysql
此处使用mysql来作为元数据存储的数据库,安装详情见文章:
https://blog.csdn.net/qinshi965273101/article/details/84261723
hive集成mysql的配置
注意:hive支持的mysql数据库编码集必须是latin1,否则无法使用。
进入conf目录下
- cp hive-default.xml.template hive-site.xml
- vim hive-site.xml
清空<configuration></configuration>标签中的内容,并添加如下配置
<property>
<!-- mysql的地址,若hive数据库不存在则自动创建 -->
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop01:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
</property>
- 在hive的lib目录下添加mysql的jdbc驱动包
- 再启动hive即可,启动后会在mysql自动创建一个hive的数据库,里面存储着hive的元数据信息
Hive源数据信息对应mysql数据库表
可以参考博客园文章:https://www.cnblogs.com/qingyunzong/p/8710356.html