以下是Apache Hive中一些常用的命令,适用于Hive的命令行界面(CLI)或其他客户端工具:
数据库操作
-
创建数据库:
CREATE DATABASE IF NOT EXISTS my_database;
-
切换当前数据库:
USE my_database;
-
查看所有数据库:
SHOW DATABASES;
-
删除数据库:
DROP DATABASE IF EXISTS my_database CASCADE;
表操作
-
创建表:
CREATE TABLE employees ( id INT, name STRING, );
-
外部表创建:
CREATE EXTERNAL TABLE employees ( id INT, name STRING ) LOCATION '/path/to/data';
-
查看所有表:
SHOW TABLES;
-
描述表结构:
DESCRIBE employees;
-
插入数据:
INSERT INTO TABLE employees VALUES (1, 'John');
-
查询数据:
SELECT * FROM employees;
-
更新和删除:
- 注意: Hive不支持行级别的
UPDATE
和DELETE
,但可以通过INSERT OVERWRITE
或MERGE
语句间接实现。
- 注意: Hive不支持行级别的
-
分区表操作:
ALTER TABLE employees ADD PARTITION (year=2022, month=01);
-
桶表操作:
CREATE TABLE employees_bucketed ( id INT, name STRING ) CLUSTERED BY (id) INTO 4 BUCKETS;
-
删除表:
DROP TABLE IF EXISTS employees;
其他常用命令
-
加载数据到表:
LOAD DATA LOCAL INPATH '/local/path/data.txt' INTO TABLE employees;
-
清空表数据:
TRUNCATE TABLE employees;
-
执行HQL脚本文件:
hive -f /path/to/script.hql
以上命令为基本操作示例,实际使用时请根据具体需求调整。在处理大数据时,Hive还提供了丰富的SQL-like查询语法以及各种聚合、排序、分组等功能。