参考博文:Linux环境Hive安装配置及使用
所有[ ]中的都是可选择(省略)的
一、数据库
1.查看当前数据库
hive> SHOW DATABASES;
2.创建数据库
hive> CREATE DATABASE [IF NOT EXISTS] 数据库名;
3.创建库指定hdfs路径
hive> CREATE DATABASE 数据库名 location '路径';
二、表
1.查看所有表
hive> SHOW TABLES;
2.创建表
hive> CREATE TABLE 表名;
3.删除表
hive> DROP TABLE 表名;
4.创建分区表
HIVE数据类型
HIVE | 长度 |
---|---|
TINYINT | 8位二进制 |
SMALLINT | 2byte有符号整数 |
INT | 4byte有符号整数 |
BIGINT | 8byte有符号整数 |
BOOLEAN | false/true |
FLOAT | 单精度浮点 |
DOUBLE | 双精度浮点 |
STRING | 字符 |
BINARY | 字节数组 |
hive> CREATA TABLE 表名(列名称 数据类型,列名称 数据类型) partitioned by(列名称 数据类型[,列名称 数据类型])row format delimited fields terminated by ‘切割符’;
#分区中的参数不要与原表中的参数一样;
#多个参数或是多个分区参数用,隔开
#row foramat..是指定列切割符,lines terminated by '切割符'是指定行切割符
5.操作分区表
- 查看表的分区
hive> SHOW PARTITION 表名;
- 增加分区
#增加单个分区
hive> ALTER TABLE 表名 ADD PARTITION(列名称 数据类型);
#增加多级分区
hive> ALTER TABLE 表名 ADD PARTITION(列名称 数据类型) PARTITION(列名称 数据类型);
- 删除分区
#删除单个分区
hive> ALTER TABLE 表名 DROP PARTITION(列名称 数据类型);
#删除多个分区
hive> ALTER TABLE 表名 DROP PARTITION(列名称 数据类型),PARTITION(列名称 数据类型);
- 查看表结构
hive> DESCRIBE 表名; #仅表结构
hive> DESC FORMATTED 表名;
#有除表结构外的其他信息,同时表结构也较为直观;
- 数据装载(导入数据)
hive> LOAD DATA [LOCAL] INPATH '路径' INTO TABLE 表名 [PARTITION(分区参数)];
- 修改分隔符
hive> ALTER TABLE 表名 SET SERDEPROPERTIES('filed.delim'='分割符');