Hive内置存储元数据的数据库为derby。但是使用时会有问题,开启Hive之后会占用元数据库,而derby不与其他客户端共享数据。所以一次只能有一个客户端在使用,如果开了另一个客户端就会连接不上。
另外,启动hive时,会在启动的目录创建metasore_db。
假设我在bin目录启动hive,因为本地配了HIVE_HOME,所以直接输 hive就可以启动。此时bin目录就有metasore_db。
如果我再进入其他目录,如conf,输出hive,能成功启动。但是当输入命令时,会报错如下:
退出后发现多了metastore_db。
此时把bin下面的metastore_db拷贝过来
然后再执行hive,然后查询表和数据都没问题。
tips: 元数据只是存储表的一些基本信息,表的具体内容都存在hdfs。元数据指向hdfs。
只要有元数据,就能取到hdfs的数据。如果我们直接在hdfs增加数据,不是通过hive sql增加,hive这边其实也会取到。