1、创建数据库
1)创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。
![]()
2)创建一个数据库,指定数据库在 HDFS 上存放的位置。
![]()
2、修改数据库
用户可以使用 ALTER DATABASE 命令为某个数据库的 DBPROPERTIES 设置键-值对 属性值,来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的,包括数 据库名和数据库所在的目录位置。
3、查询数据库


4、删除数据库
![]()
如果数据库不为空,可以采用 cascade 命令,强制删除:
![]()
5、创建表
建表语法:

5.1、管理表
默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive 会(或多 或少地)控制着数据的生命周期。Hive 默认情况下会将这些表的数据存储在由配置项 hive.metastore.warehouse.dir(例如,/user/hive/warehouse)所定义的目录的子目录下。当我们 删除一个管理表时,Hive 也会删除这个表中数据。管理表不适合和其他工具共享数据。
5.2、外部表
因为表是外部表,所有 Hive 并非认为其完全拥有这份数据。删除该表并不会删除掉这 份数据,不过描述表的元数据信息会被删除掉。
6、分区表
分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区 所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的 数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查 询效率会提高很多。
6.1、分区表基本操作
(1)、创建分区表语法

(2)、加载数据到分区表中

(3)、查询分区表中数据

多分区联合查询

(4)、增加分区
![]()
![]()
(5)、删除分区
![]()
![]()
(6)、查看分区表有多少分区

(7)、查看分区表结构
![]()
7、修改表
7.1、重命名表
![]()
7.2、更新列、添加和替换列
![]()
![]()
8、删除表
hive (default)> drop table dept_partition;
282

被折叠的 条评论
为什么被折叠?



