Hive 数据库相关基本语法

最新推荐文章于 2024-08-07 10:49:21 发布

青青水草

最新推荐文章于 2024-08-07 10:49:21 发布

阅读量634

点赞数

分类专栏： hive

本文链接：https://blog.csdn.net/nihaoma_ff/article/details/70596508

版权

hive 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

创建数据库：

hive> create database if not exists hive2;
OK
Time taken: 0.257 seconds
hive> drop table hive2;
OK
Time taken: 0.224 seconds

创建存在的数据库，系统会报错：

hive> create database hive2;
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Database hive2 already exists

避免创建重复的数据库，系统报错，可以使用如下的语句：

hive> create database if not exists hive2;
OK
Time taken: 0.031 seconds

删除数据库：

hive> drop databses hive2;

数据库所在目录默认是hive.metastore.warehouse.dir 指定的目录，例如：

<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
  <description>location of default database for the warehouse</description>
</property>

创建数据库时，如果不指定目录，数据将存储在 /user/hive/warehouse 这个子目录中，创建数据库时也可以指定目录，例如：

hive> create database hive2 location '/user/hive/databaseDir/';
OK
Time taken: 0.071 seconds

在hdfs中如下格式，是以 .db 结尾的
创建数据库时可以为数据库添加描述信息：

hive> create database hive3 comment 'test database comment';
OK
Time taken: 0.056 seconds

使用describe database database_name 能够查看描述语句以及数据库所在的文件目录位置：

hive> describe database hive3;
OK
db_name	comment	location	owner_name	owner_type	parameters
hives	test database comment	hdfs://localhost:9000/user/hive/warehouse/hive3.db	hadoop	USER	
Time taken: 0.033 seconds, Fetched: 1 row(s)

创建数据库时可以指定键值对信息：

hive> create database hive4 with dbproperties('creator' = 'root','date'= '2017-04-24');
OK
Time taken: 0.066 seconds

同过describe database extended database_name 语句可以查看：

hive> describe database extended hive4;
OK
db_name	comment	location	owner_name	owner_type	parameters
hive4		hdfs://localhost:9000/user/hive/warehouse/hive4.db	hadoop	USER	{date=2017-04-24, creator=root}
Time taken: 0.031 seconds, Fetched: 1 row(s)

hive 没有命令可以查看当前使用的是哪个数据库，这个很遗憾。但是可以通过设置
hive.cli.print.current.db=true 显示出当前使用的数据库。

hive> set hive.cli.print.current.db=true;
hive (default)> use hive2;
OK
Time taken: 0.024 seconds
hive (hive2)> use default;
OK
Time taken: 0.027 seconds

删除数据库HQL：

hive (default)> drop database if exists hive2;
OK
Time taken: 0.054 seconds

默认情况下，hive不允许删除非空的数据库：

hive (default)> use hive4;
OK
Time taken: 0.022 seconds
hive (hive4)> create table T1(name string,age int);
OK
Time taken: 0.15 seconds
hive (hive4)> drop database hive4;
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. InvalidOperationException(message:Database hive4 is not empty. One or more tables exist.)

可以在语句后加上关键字cascade关键字，这样可以让hive先删除数据库中的表，然后再删除数据库：

hive (hive4)> drop database hive4 cascade;
OK
Time taken: 2.202 seconds

提示符这里是不会自动刷新的，可以切到其他数据库，再切到hive4 的时候，将会报错：

hive (hive4)> use default;
OK
Time taken: 0.026 seconds
hive (default)> use hiv4;
FAILED: SemanticException [Error 10072]: Database does not exist: hiv4

注意：数据库删除后，对应的目录也会被删除，hive4.db 目录不存在了